由于自然和人为灾害,企业网络和数据访问可能会毫无征兆地被中断。当然,您可能无法阻止所有这一切的发生,但是如果有一个好的灾难恢复计划,您就可以更好地应对这些意外事件。
飓风、龙卷风、地震、火灾、洪水、恐怖袭击以及网络攻击,您要知道所有这些问题都可能会随时发生在您的公司。您可能也已经制定了灾难恢复(DR)计划,来保护企业的数据、员工和业务安全。
但是您的灾难恢复计划考虑得周全吗?它上次进行更新和测试是什么时候?您是否考虑过采用新技术和服务,使灾难恢复工作变得更容易?以下为您列出了IT灾难恢复计划应该涵盖的7大关键事项,一起来看看吧:
1. 分析所有潜在的威胁及其可能发生的反应
研究公司IDC的数据恢复研究总监Phil Goodwin建议称,您的灾难恢复计划应该考虑到“潜在中断”对您业务全方位的影响。然后,您应该针对每种情况制定一份恢复计划。例如,Goodwin表示:
“如果发生了一次网络攻击,关闭了华盛顿特区(D.C.)的服务器,那么您有针对该场景的过渡计划吗?”
当然,并非所有场景都会发生。所以,应该尽您所能地去尝试预测哪些潜在的中断最有可能出现。Goodwin指出,不幸的是,网络攻击正在成为“最有可能发生的场景”。因此,在您的灾难恢复计划中,应该将针对网络攻击的计划置于优先位置。
2. 业务影响分析(business impact analysis,简称BIA)
SAP公司总裁兼首席执行官Mark Testoni建议称,为了有效地确定灾难恢复优先级,应该对每个主要信息系统进行业务影响分析。
跟据Gartner的说法,业务影响分析会“识别和评估自然以及人为灾害对业务运营产生的潜在影响(金融、生命/安全、监管、法律/合同、信誉等等)。”
Testoni指出,
“对主要IT系统进行一次全面的业务影响分析,将有助于确定系统的优先级和相关性。这有助于对系统进行优先级排序,制定恢复策略和减少损失的优先事项。业务影响分析检查三个安全目标:保密性、完整性以及可用性。 制定一个全面的灾难恢复计划的标准方法是:首先制定政策,然后进行业务影响分析,通过业务影响分析建立优先次序后,制定应急策略,并在应急计划中正式实施。 ”
您可以在Ready.gov和国家标准与技术研究所等网站上,找到业务影响分析模板和问卷。
3. 员工
Goodwin表示,许多企业在其灾难恢复计划中常犯的错误是“过分关注技术,而不太重视人员和过程”。IT是一个使能者(enabler)。永远不要忘记,您不仅仅是要恢复数据和服务器。他建议,可以考虑如何在整个企业环境内制定一个灾难恢复计划。他说,
“您需要从您的用户社区获得哪些行为?灾难发生后,他们需要什么样的帮助才能重新启动并运行?”
FBI网络部前安全顾问兼发言人John Iannarelli表示,除此之外,还应当确定负责应对危机的关键人员;确保您有他们的电子邮件、手机号码以及家庭座机号等信息;明确危机处理期间的当班者;知道您应向谁求助,例如执法部门,如果可能的话,在灾难发生前就要与当局建立好联系;事先确定好在灾难发生时,谁将代表公司面对受害者、客户和员工。最后,他还补充说,发言人还需要想好打算说什么,打算披露多少信息,以及如何处理好让那些怀疑贵公司业务能力的人感到放心。
4. 更新
Gartner公司的IT基础设施战略研究总监Mark Jaggers指出,组织易犯的另一重大错误,是在对其内部系统进行更改后(例如进行了重大的软件更新),并没有更新其灾难恢复计划。除非考虑到目前使用的所有技术、系统和应用程序,否则您的计划并不完整。
此外,自制定完成灾难恢复计划以来,可能还会有新的技术或产品出现。灾难恢复计划是基于计划完成时,对可用过程和工具的假设。网络弹性公司Veriflow的产品管理副总裁Milind Kulkarni指出,
“由于如今的技术发展比以往任何时候都更快,创新也总是会从意想不到的地方涌现出来,这些假设可能会发生重大变化。计算机科学和预测算法的进步,以及价格合理的超强计算能力等因素,促进了新方法和解决方案的出现,保证了IT系统的弹性、正常运行时间、可用性和灾难恢复能力。”
例如,通过亚马逊的AWS Snowball等服务,企业可以把PB级(千万亿字节)的业务数据转移到现场专用安全设备上。传输完成后,就可以将设备发送到您选择的AWS中心,在该中心将您的数据传送到云端。Kulkarni指出,AWS Snowball和其他类似的服务为企业提供了创新且价格合理的新方法,来确保数据冗余——这是任何一个灾难恢复计划的基础。
5. 优先事项
Iannarelli建议称,确定什么是最重要的。并不是所有的业务都值得保存或者需要保护。当然,您的个人信息是的!但任何已公开发布的信息都不那么重要。试想一下,如果您的房子着火了,在您跑出家门时最想抓在手里带出火海的是什么?
6. 定期地练习和演练
Kulkarni警告称,只是制定灾难恢复计划是不够的。还需要定期对该计划进行测试,人们需要实践练习,就像学校会定期让学生参加消防和应急演习一样。如果不经常演练,该计划将是无效的。
7. 考虑灾难恢复即服务(disaster recovery as a service,简称DRaaS)
将数据操作业务转移到云端的做法日益流行,这有助于实现灾难恢复即服务(DRaaS)。Goodwin认为,诸如iland和IBM等提供商所提供的按需服务,使灾难恢复工作变得更容易且更经济,同时也让更多的企业能够更好地应对灾难。
Goodwin建议称,在考虑DRaaS时,需要询问供应商将如何测试和验证数据及工作流程的恢复状态,因为有些测试可能会比其他测试的范围要广。
不要等待
Iannarelli表示,大多数公司犯下的最大错误,就是等到发生网络攻击或者灾难之后,才去想下一步该怎么做。他说,
“在联邦调查局工作的20多年时间里,我从来没有见过任何人因为数据泄露而被公司解雇。但我看到很多人因为没有能处理好泄露事件而被解雇。”
CIO之家 www.ciozj.com 公众号:imciow