数据中心灾备体系设计
张宗杰 黎凯伦 网络收集
  数据中心灾备体系设计主要由三部分组成:灾备需求分析、灾备技术体系设计与灾备管理制度设计。灾备需求分析是根据数据中心的业务特点与系统特点,分析存在的风险;灾备技术体系设计则是为达到灾备需求的旧标而进行的具体技术实现;灾备管理制度设计则是为确保灾备系统规范运作而设立的管理制度。由于《规范》中对灾备管理制度的设计已经提出了比较明确的设计方法与要求,本文将不再赘述,而将重点放在介绍灾备需求分析与灾备技术体系设计方面,为相关工作的具体实施提供参考。

    一、区域数据中心灾备需求分析

    (一)风险分析

    全面详尽的风险分析是数据中心灾备体系设计的基础,风险分析方法包括:

    1.资产识别,主要包括:基础设施、硬件、软件、数据、文档、服务和声誉等。单位应对资产进行分类,以区分资产的不同重要程度并确定重要资产的范围,应X对资产进行标识以区分资产对业务正常运作的影响程度,据此确定资产的等级。

    2.威胁识别,即识别信息资产构成潜在破坏的可能性因素,如自然因素与人为因素,内部因素与外部因素等。

    3.脆弱性识别,即识别可能被威胁利用的信息资产的弱点,主要包括技术与管理两个方面。技术脆弱性涉及物理层、网络层、系统层、应用层等各个层面的安全问题;管理脆弱性可分为技术管理脆弱性和组织管理脆弱性两方面,前者与具体技术活动相关,后者与管理环境相关。

    具体分析活动可通过问卷调查、工具检测、人工核查、文档查阅和渗透性测试等方式开展。完成风险分析后,需要根据灾难发生的可能性、灾难发生后的损失预计等因素,计算对应的风险值,进行风险分级,为后续分析工作提供参考。

    (二)业务影响分析

    1.定义

    业务影响分析(Business Impact Analysis,BIA)的目的是确定不同业务遭遇到风险后对企业的影响程度。通过分析有形的和无形的影响,估算对停止业务时间长短的接受情况和使影响降至最低的处理需求,对灾备的其体实现提出明确要求。BIA的目标包括:(1)识别和量化每个业务单元或者资源对整个企业在业务运行方面的影响;(2).识别潜在的失效场景和评估潜在的威胁;(3)定义针对不同的灾难恢复要求所需要的不同级别的投资情况;(4)建立灾难恢复时的恢复流程优先级,指导灾难备份恢复策略的制订。

    2.BIA业务影响分析的方法

    (1)业务功能地位分析。可从业务功能的政策要求、是否核心业务、业务涉及的机构与用户范围、业务处理实时性与频度、业务功能与机构内外其他业务功能的关联等多个角度综合分析。

    (2)业务中断影响评估。主要包括两个方面,一是以量化的方法,评估业务中断可能带来的直接与间接经济损失;二是以非量化的方法,评估业务中断所引发的社会影响、法律影响、信用影响、品牌影响等。

    业务影响分析最终将影响对灾难备份体系的需求,根据《规范》的要求,灾备体系的需求必须明确需求等级、各等级对应的最低恢复要求以及恢复的优先级。主要指标是RTO(Recover Time 0bjec—rive),即灾难发生后,信息系统从停顿到恢复正常的时间要求,以及RPO(Recover Point 0hieetive),即灾难发生后,数据必须恢复到正常状态的时间要求。灾难恢复能力等级与上述两项指标的参照要求如表1所示。

表1灾难恢复能力等级及RTO、RPO指标要求

 

 

 (三)基础架构分析

    数据中心技术体系分析是灾备技术体系建设的基础,灾备技术体系与数据技术体系匹配程度的高低,决定了灾备中心对数据中心生产环境的可替代程度,对于高效实现灾难恢复,提高灾备中心可用性有重要意义。对数据中心技术体系的分析主要从以下两方面人手。

    1.基础运行环境分析。在确保灾备中心与数据中心技术架构基本一致的前提下,明确所需要的设备类型和数量,对机房配电、空调、地板承重以及布线的具体要求等基础环境信息,为选择具体的灾备环境提供参考。

    2.应用部署特点分析。主要分析各类应用部署平台的情况、应用之间的数据依赖关系、应用正常运行需要数据质量、应用正常启动和异常启动需要的时间等关键因素,作为灾备中心应用体系构建的基础。
 

CIO之家 www.ciozj.com 公众号:imciow
关联的文档
也许您喜欢