数据中心迁移往往是复杂而具有风险的。以下这些最佳实践将帮助组织管理者投入适量的时间和资金进行规划、执行以及测试,以保障组织的业务正常运营,并最大限度地提高成功迁移数据中心的机会。
组织面临的关键挑战
主机托管,并购活动,过时设施,整合措施,以及增加数据中心容量的新方法往往需要将IT设备从一个数据中心迁移到另一个数据中心。
大多数数据中心迁移由于计划不当或缺乏专门的团队和资源而导致费用超支和性能下降。
现有的工作人员在规划和组织IT设备从一个数据中心迁移到另一个数据中心时往往缺乏经验。
数据中心迁移的规划
组织的领导者将数据中心迁移作为基础设施交付战略的一部分进行规划:
如果企业并不具备专业知识和技能来有效规划、管理、执行数据中心迁移项目,那么采取合作方式,获得外部的专业知识是一个行之有效的方法。
在项目的各个阶段设计并执行一个强有力的沟通计划,经常与所有受影响的公众接触,并提供完整的信息。
通过使用灾难恢复(DR)程序进行测试,制定风险缓解、迁移和回退计划。
不断记录整个项目的过程,为以后评估和关闭整理制定经验教训和参考资料。
这个研究考察了数据中心迁移的最佳实践。这不是对所有迁移方法的全面审查。相反,这是一个最佳实践清单,旨在帮助企业领导者在数据中心迁移过程中取得成功。
数据中心迁移不仅仅是建立一个基础设施,并将工作负载从A点转移到B点。这往往是一个复杂而危险的项目,拥有正确的流程和专业知识至关重要。而制定完美的计划对数据中心的成功迁移来说至关重要。但是,如果组织内部没有合适的资源制定正确的规划,则必须将这些内部资源与外部资源相结合,才能有效地规划、管理、执行移植项目。企业领导者必须防止数据中心项目对业务造成不利影响。他们必须确保应用程序和服务继续正常运行,以确保停机时间最短,性能不会下降。
为了帮助企业领导者实现这一目标,以下内容集中讨论数据中心迁移的15个最佳实践。
图1 数据中心迁移的15个最佳实践
大多数成功的数据中心迁移项目都有类似的实践,如专业知识、准备、管理、执行、沟通,以及业务联盟等。这项研究的目的不是要对这些实践中的每一项进行深入的研究,而是提供一个务实的最佳实践清单。这来源于多年对数据中心迁移项目实践的观察和总结。
根据数据中心迁移成功的步骤,将数据中心迁移的15个最佳实践整理组织成图1所示的五个主要步骤:启动、风险评估、计划、执行,以及关闭。但是,组织可能会根据其迁移情况改变这些最佳实践的顺序。他们也可以将这些最佳实践应用于多个环境(例如,本地数据中心,托管数据中心,或云计算)。
数据中心迁移项目应考虑的15个最佳实践
以下介绍了数据中心迁移项目中应考虑的15个最佳实践。
(1)掌握技能和专长
企业的工作人员掌握正确的技能和专业知识是至关重要的。由于数据中心迁移并不是日常工作的一部分,现有的工作人员在规划和组织IT设备从一个数据中心迁移到另一个数据中心时往往缺乏经验。企业领导者必须评估其内部资源是否可用,并且能够有效地规划、管理和执行迁移。如果缺乏内部资源,建议与合作伙伴合作,采用外部的专业知识和技能。
注意:数据中心迁移项目失败的一个主要原因是企业的领导团队通常将数据中心迁移视为设备迁移项目。但是,数据中心迁移的大多数工作以及大部分风险都在于制定工作量迁移计划。其迁移设备是最简单的部分,而工作负载安排、依赖关系、业务影响,以及风险是难点。
(2)成立项目团队
重大或复杂的数据中心迁移需要一个敬业的管理者。这个管理者应该与所有相关的代表进行协调,并建立一个团队。管理应该有权力分配资源和人员。
而这个团队成员不仅要成为所在领域的专家,还要乐于学习相关学科,因为解决所有设备的相互依赖关系是至关重要的。数据中心迁移的计划越详细或者越广泛,团队成员就越有可能需要运用全职工作时间开展工作。而这些工作人员的经验和技能要切合实际应用,随时准备在外部帮助下提高技能。对于时间较长的项目,请注意可能需要更改计划:在项目期间,当团队成员转移到其他角色时,他们的技能将需要被更新。
(3)做好项目准备
成功的数据中心迁移取决于以前的准备和高级计划。企业应该建立一个包括IT和业务代表的委员会,以充分考虑所有必要的资源,其包括:
迁移成本
现有的软件、硬件、服务、维护、灾难恢复、设施,以及其他项目的合同
项目准备还应该包括以下任务:
创建设备和应用程序的详细清单
进行业务影响分析(BIA)审查
这些基本的任务应该包含详细的评估或审计,确切地说需要什么时候迁移,以及如何迁移。
迁移的排演也是其筹备过程中不可或缺的一部分。为了确保所有部门都了解这个过程,组织应该首先定义在纸面上的演练,必要时进行迭代更新。然后,组织应在项目期间安排多次迁移演练,以验证假设并确定迁移时间和资源可用性等关键信息。
(4)简化过程
移动的东西越少,迁移越容易。因此,在数据中心开始迁移过程之前尽可能简化、最小化、虚拟化、整合,以及消除。
(5)评估相互依赖性
在部分风险评估阶段(通常称为"发现阶段")应该包括对应用程序和IT设备(服务器,存储和网络)之间相互依存关系的详细评估。这一评估将有助于确定分阶段迁移的可行性和细节。建议组织在风险评估阶段使用多种工具,包括配置管理数据库(CMDB)工具等。
(6)进行沟通
在迁移项目的各个阶段执行有效的沟通计划对于消除谣言和虚假的信息来源至关重要。沟通应该让所有相关人士参与,并明确分配角色和责任。
组织向内部IT人员和受影响的业务部门宣传数据中心迁移注意事项也是避免意外的关键。组织的人力资源可以提供很大的帮助,特别是在人员受到影响的情况下。宣传迁移的意义,失败和成功等情况。制定详细的员工和管理沟通计划,并定期提供更新(最好通过网站不断更新)。
(7)规划
数据中心迁移通常分阶段进行。阶段的数量经常根据数据中心规模,服务风险水平,预算和时间限制等因素而变化。大多数组织使用以下多阶段方法的结合:
首先,组织迁移低风险的部分,在迁移过程中遇到某些问题及时纠正。
一旦整个过程稳固,员工需要在处理突发事件方面训练有素,组织才会迁移高风险的部分。
(8)应急计划
数据中心在迁移过程中会出现问题。组织面临的挑战是提前发现这些问题,并制定适当的风险缓解措施。其成功的关键是具备一个良好扎实的准备阶段。例如,IT设备和网络链接的详细清单通常是应急计划的基础。此外,应急计划中还应包括临时设备和备用系统。
(9)预先测试
实践改进绩效。在迁移设备之前,运行一组完整的测试,以建立基础设施和应用程序的可操作性、功能和性能的"基准".
(10)迁移
为避免出现意外错误,请在数据中心迁移开始之前规定"更改冻结"期限,并在迁移之后结束。
在迁移过程中,请准备好面对常见问题,如网络连接问题,不正确的凭据(用户名和密码)以及缺少验证/测试。这些问题可能会对其他工作负载移动产生级联影响,特别是在升级路径尚未正确确定的时候。因此,这些问题可能会延长冻结期,并对项目造成负面影响。
(11)测试
对于所有的测试,采用基于风险的方法,结合业务影响分析(BIA)的结果和业务主题专家(SME)的意见。例如,执行应用程序级别的测试时,请确保应用程序所有者/业务单位参与验证工作和签出过程。
不要忘记在测试计划中包含故障转移方案。
(12)迁移后进行测试
使用在预迁移阶段执行的相同测试用例,并将迁移之后结果与基准结果进行比较。结果的差异可能表明在迁移过程中出现了新的问题。解决所有发现的问题。
在迁移成功后,要特别注意在线交易处理性能,峰值性能和批处理性能方面的差异。最后,请仔细检查所有服务是否在功能、弹性、性能方面进行了全面测试。
(13)审计
建议组织对迁移项目进行事后审查和审核。审查应包括对以下方面的评估:
项目过程
符合最初的业务计划和设计规范
符合项目进度
项目成员和利益相关者的反馈
这次审查将为组织提供宝贵的见解、关键的成功因素、经验教训和知识,可以结合到组织的其他项目。组织吸取的教训可以使未来的项目更加有效。
(14)关闭
正确执行关闭措施,确保未来隐藏的费用或支出不会继续影响IT运行。例如,采取以下步骤:
关闭原有的IT设备的服务合同
关闭不再使用的软件合同
消化剩余的存储资产(包括复印机)
取消大厦管理、维修服务和供应服务的供应商合同
(15)更新
最后,在数据中心迁移完成后,组织应该对其流程,程序和文档(包括灾难恢复计划,合规测试和审计证书)进行更新。另外,验证是否所有支持系统(例如,CMDB)都已正确更新。新的数据中心可能会有不同的设置,这也可能需要对运营团队进行培训。最后,认可和营销也很重要。通过各方面的努力,促进数据中心的成功迁移。
CIO之家 www.ciozj.com 公众号:imciow