信息系统灾备技术综论
杨义先 姚文斌 陈钊 网络
 发生在美国的“9·11”事件使国际社会认识到灾难防范保护的重要性。据国际调研机构Gartner公司研究报告显示,相对于2001年只有不到25%的大型企业实行业务连续性计划,到2005年将有70%的大型企业开始引入业务连续性计划。对企业而言,灾难恢复已经成为关系到企业的生存与可持续发展的重要保障。

自2003年起,党中央和国务院办公厅陆续下发了《国家信息化领导小组关于加强信息安全保障工作的意见》、《关于做好重要信息系统灾难备份工作的通知》、《国家信息安全战略报告》、《国家信息安全“十一五”规划》等文件,特别是汶川大地震后,企业更是加快了信息系统灾备建设的步伐。

2008年国家成立的灾备技术国家工程实验室。专门进行灾备行业相关的法律和法规的制定,着手建立适合我国信息化系统的灾备标准体系,提供国家级灾备系统服务和相关技术体系支撑,培养灾备专业人才梯队工作,已经成为保障国家信息化系统安全保障建设的重要力量。

2灾备系统指标

根据信息系统灾难恢复规范与重要信息系统灾难恢复指南中的定义心剖:灾难是指由于人为或自然的原因,造成信息系统严重故障或瘫痪,使信息系统支持的业务功能停顿或服务水平降至不可接受、达到特定的时间的突发性事件。典型的灾难事件包括自然灾难(如火灾、水灾、地震、风灾等)、设备灾难(如设备故障、软件错误、电信网络中断和电力故障等)和人为灾难(如操作员错误、破坏、植入有害代码和恐怖袭击等)。因此,信息系统灾难已经涉及信息系统运行的诸多方面,容灾抗毁能力已经成为衡量信息系统安全性和可靠性的重要指标,其内容包括以下4个指标:

1)恢复点目标(RPO,recovery point objeet),指出现灾难之时到可以让业务继续运作的时间;

2)恢复时间目标(RTO,recovery time 0bject),指从IT系统宕机导致业务停顿之刻开始,到IT系统恢复至可以支持各部门运作,业务恢复运营的时间;

3)降级操作目标(DOO,degraded operations ob—ject),主要考虑宕机恢复以后到第2次故障的灾难以后的时间;

4)网络恢复目标(NRO,network recovery ob—ject),即用户在灾难后可以连接到灾备中心的时间,4个指标之间的时序关系如图1所示。

 

图1 RPO、RTO和NRO时间参数

国家对银行、电力、证券、保险等重点行业信息系统的灾备等级和RTO/RPO指标进行了严格的规定,但对非金融机构以及非单一系统的灾备等级和RTO/RPO指标的制定,则是一件十分困难的事情,需考虑各方面的因素,包括:是否具备应急手段、人工补录的时间和成本、技术可行性、投资成本、内/外部影响、法律法规、运营/生产效率等方面进行定性的评估。

 
图2 灾难成本与灾难持续时间的关系

RTO/RPO指标由业务需求、技术实现、业务依赖关系、投资和影响等四大方面决定,是管理层、业务部门、IT部门3方面相互妥协的结果,如图2所示,当前也有人已经开始针对RPO和RTO建立策略模型。试图通过这种方法来更加直观和科学地制定灾备策略。

3传统灾备技术

在灾备系统建设中,需要关注数据容灾、系统容灾和应用容灾,其中,数据容灾是前提,只有保证数据能及时、完整地复制到灾备中心,才能在灾难发生时及时恢复受灾业务;系统容灾是实现灾难恢复的基础,要求信息系统本身具有容灾抗毁能力;应用容灾是实现信息系统保持业务连续性、不间断服务的关键。

3.1数据容灾

3.1.1快照技术

数据快照(snapshot)是指对指定数据集合的一个完全可用拷贝,该拷贝包括相应数据在某个时间点(拷贝开始的时间点)的映像,快照技术具有备份和恢复窗口短、性能损失小、容量利用率高等优点,适合保护人为失误等软故障造成的数据损失,但快照技术无法实现实时数据备份,现在的主流快照技术包括以镜像分裂快照技术、按需备份快照技术、指针重映射快照技术、增量快照技术等。

3.1.2数据复制技术

数据复制技术即数据镜像技术,主要分为基于磁盘系统、基于虚拟存储、基于主机、基于存储区域网络、基于数据库和基于应用的数据复制技术,其中除了基于数据库的数据复制以外,其他的数据复制方式都具有同步和异步2种复制方式。在灾备中心的建设过程中,根据不同的数据复制技术可以进行不同策略的灾难备份。
 1)基于磁盘系统的数据复制技术

基于磁盘系统的数据复制技术(见图3)指的是主备机房的磁盘系统通过磁盘镜像技术来实现数据复制,通过存储系统内建的固件(firmware)或操作系统,利用IP网络或DWDM、光纤通道等传输界面连结,将数据以同步或异步的方式复制到远端。采用基于磁盘系统的数据复制技术建设灾备系统是目前金融电信企业、政府各部门采用较多的容灾方案.基于磁盘系统的数据复制产品包括:EMC的SRDF、IBM的PPRC技术和HP的HP XParrays。

 

图3 4种主要的数据复制技术

2)基于主机的数据复制

采用基于主机系统的容灾方式的核心是利用生产中心和备份中心的主机系统通过IP网络建立数据传输通道,通过主机数据管理软件实现数据的远程复制,当主数据中心的数据遭到破坏时,可以随时从备份中心恢复应用或从备份中心恢复数据。

目前基于主机的数据复制技术产品主要有:应用在IBM公司大型机中的extended remote copy(XRC)软件,使用基于主机的数据移动器从磁盘阵列中的非易失性随机访问存储器(NVRAM)中提取数据写到磁盘日志和远程站点;Veritas公司的vefitas volume replicator(VVR)数据复制管理软件,该软件采用了可靠链接和监听协议,向远程备份系统同步进行逻辑卷复制。

这些基于主机逻辑卷的数据复制技术数据传输比较可靠,效率也相对较高;系统扩展时对硬件设备尤其是存储设备的限制小,但是使用该方法进行灾备建设对软件要求较高;同时不可避免地对服务器性能也会有影响(如占用服务器的CPU和内存等资源);此外,这类软件无法提供基于时间点的快照功能。

3)基于存储区域网络的数据复制

存储区域网络(SAN)通过专用的集线器、交换机和网关建立起与服务器和存储设备之间的直接连接,SAN中数据存储管理的核心是数据备份。SAN技术使存储设备不用再附属于某个服务器,允许存储设备真正与服务器隔离,从而组成与计算机网相对应的存储区域网络。SAN可以允许在存储设备之间传输、复制数据,实现无主机的备份。HP公司的连续存取存储专用服务器(CASA)在SAN中实现了同步镜像模式的数据复制。同时,HP实验室的Seneca系统也在研究如何在SAN中更好地进行数据复制,以数据镜像的方式保护数据。

4)基于数据库层面的数据复制

数据库级容灾是建立在数据库基础上,它将源数据库中的数据库通过逻辑的方式在异地建立一个同样的数据库,并且实时更新,当主数据库发生灾难时可及时接管业务系统,达到容灾的目的,以Oracle数据库为例,数据库级容灾方式主要由第三方软件或Oracle自带的data guard引中的logical standby来实现,其传输的是结构化查询语言(SQL)指令或重做日志文件。

采用数据库层面的数据复制技术进行灾备建设具有投资少、无需增加额外硬件设备、可完全支持异构环境的复制等优点。但是,该技术对数据库的版本和操作系统平台有特定要求,发生网络故障时将无法保证生产中心和备份中心数据的完全一致性。

5)基于应用层面的数据复制

应用层面的数据复制通过应用程序与主备中心的数据库进行同步或异步的写操作以保证主备中心数据一致性,基于应用层面的数据复制技术,灾备中心可以和生产中心一样正常运行,既能容灾,还可实现部分功能分担。但是该技术的实现方式复杂,实现和维护难度较高,并且使用应用层面的数据复制会提高系统的风险与数据丢失的风险。

3.2系统级容灾

系统级容灾技术保证系统的可用性,避免计划外停机。系统级容灾技术包括冗余技术、集群技术、网络恢复等技术。其中,冗余技术主要对磁盘系统(RAID)、电源系统和网络进行备份,在系统的主部件发生故障时冗余部件能代替主部件继续工作,避免系统停机;集群技术可以利用分散的主机保证操作系统的高可用性;网络恢复技术可以在交换机网络层实现动态网络路由重选,在不中断用户操作的情况下转入灾备中心。

3.3应用级容灾

应用级容灾通过负载均衡、应用集中和隔离、自动化监控等手段实现业务应用的连续性和高可用性。其中,使用负载均衡技术不但可以保证业务负载分发,还能实现故障的隔离与计划内停机维护;应用的集中和隔离可以方便用户对IT系统进行管理,减少出现故障的可能性,同时,在部分应用发生故障时,可通过应用隔离减少故障带来的影响;自动化监控手段可以有效减少人工错误操作带来的故障,同时也能及时有效地发现故障。
 

4灾备技术的发展趋势

随着信息化的发展,灾备技术的特点为:存储容量急剧膨胀,每隔6—12个月,企业数据量成倍增加;数据存储时间和方式不断延展,Intemet使网络数据能以“24h×365d”的方式处于全天候就绪状态;用户可通过多种渠道和方式实现数据的更新与修改;数据存储结构的异构性大大增强;用户对信息系统提供的服务要求更高,很多关键业务应用都要求系统可用性高达99.999%。因此,系统设备已经不再是唯一的关注焦点,信息的完整性和安全性已经超越了软/硬件系统本身的价值。

在这种趋势下灾备系统的建设面临着3个方面的改变:一是服务模型从数据存储为中心转向应用服务为中心转变;二是体系架构从集中式结构转向分布式和虚拟化相结合的共享并发模式转变;三是应用模式从孤立专用系统转向综合服务系统。

4.1 围绕服务的灾备技术

灾备技术不再只关注传统的备份冗余容错技术以及对数据、系统和应用的保护,开始逐渐向保证业务连续性目标发展,针对当前复杂的网络计算环境和面向事物处理的需要着手建立新型容灾体系结构,业务持续性是一套用来降低组织的重要营运功能遭受意外中断风险的作业程序,当前的研究重点包括灾备系统快速重建,快速部署应用以及保证数据的完整性和可用性。

4.2灾备存储关键技术的发展

面对海量数据存储的需要,灾备存储关键技术的发展主要包括重复数据删除与压缩技术、虚拟化灾备存储技术、分布式灾备存储技术和基于信息的灾备存储技术4个方面。

4.2.1 重复数据删除与碾压技术

基于磁盘的重复数据删除技术已经被大量应用于灾备存储中,该项技术通过寻找不同数据块中的冗余数据,并通过删除这些重复的数据来对数据进行压缩,某些重复数据压缩技术甚至实现了20:1的压缩比,通过重复数据删除技术不但能解决单数据中心中多副本占用空间的问题,还可以减少传输备份数据所需要的带宽,重复数据删除技术主要分为基于软件的重复数据删除和基于硬件的重复数据删除2种方式。

基于软件的重复数据删除旨在消除源的冗余,以此获得带宽的补偿.但是,基于软件的重复数据删除维护十分困难,如果想用一个全新的产品来替换原有的备份引擎,就会导致之前的数据完全不可用,主流的基于软件的重复数据删除产品有EMC的Avamar和赛门铁克的veritas netBackup等。

基于硬件的重复数据删除在存储系统本身进行数据削减,正常情况下,备份软件会将专用设备看成一般的“磁盘系统”,并且不会感知其内部正在进行的重复数据删除进程,基于硬件的重复数据删除技术具有更高的压缩比,更加适合大型企业使用。

4.2.2存储虚拟化技术

存储虚拟化(storage virtualization)按照一定的虚拟存储体系结构将不同的物理存储设备通过不同的接口协议(如SCSI、ISCSI、IFCP、FCIP等)整合成一个虚拟的存储池,为用户提供统一的数据服务,实现资源共享。通过虚拟化将物理存储设备和服务器所见的存储设备视图分开,为服务器提供统一的逻辑存储空间,使得服务器所能看到的是一个逻辑的存储空间,而无需知道实际物理存储设备的位置、路径和每个设备的具体特点,基于存储虚拟化的灾难备份技术具有5个优势:

1)可以整合各种应用服务器和存储设备(包括不同的硬件、操作系统等),无需在应用服务器上安装任何软件,远程复制的过程不会对应用服务器产生影响;

2)可以通过光纤通道获得高性能和距离的扩展;

3)方案的实施可以完全不在乎客户现有的存储设备是否支持远程数据容灾;

4)生产中心和灾备中心的多个存储设备可以作为统一的存储池来管理,存储空间利用率和存储效率大大提高。

CIO之家 www.ciozj.com 公众号:imciow
关联的文档
也许您喜欢