虚拟化技术发展到现在,大致经过三个阶段:第一阶段是以整合为主诉求的虚拟化1.0时代,核心是经营开支效率:第二阶段是灵活的资源管理的虚拟化2.0时代,核心是讲究动态资源分配;从现在开始会进入企业云和虚拟化3.0时代,自动化和资源动态可扩展是其核心。
调研发现,中国移动各省分公司、集团部门对于目前IT系统面临的挑战和虚拟化技术的优势有着较一致、充分的认识,认为虚拟化能在应对挑战方面发挥较重要作用,而且在服务器虚拟化领域已有了大量的应用案例并取得一定效果。
随着服务器虚拟化的试点和推广应用,虚拟化技术本身已经不是用户担心的首要问题,取而代之的是如何改变采购、管理和运维模式,更好地推广和应用虚拟化技术。中国移动各省分公司、集团部门在对服务器虚拟化应用方面抱有较高目标、期望的同时,也存在一定的担忧,主要表现在:
(1)资源难以有效共享和动态分配;
(2)整体利用率过低;
(3)不同系统资源利用不均衡;
(4)难以满足业务峰值的资源需求等。
虚拟化将IT资源管理提升到一个新水平,特是对运营商的基础设施和运营影响很大,将极大改变运营商的IT管理模式,包括系统的架构方式以及如何推出多元化的电信服务、确定资费政策等。当前,3G与全业务运营给通信行业IT应用带来了巨大的发展机遇,从已有典型部署看,虚拟化技术不仅实现了IT系统的高效、灵活,而且兼顾实现了低成本与绿色IT等重要目标,当然也带来了新的问题。虚拟化应以IT运维管理为先,在中国移动大力发展云计算的背景下,虚拟化作为其基础,首先思考并应对新问题,强化运维环节的技术和管理保障,以推动移动管理信息系统运维提升到更高水平。
2 虚拟化问题分析
(1)异构环境增大虚拟化资源管理难度
不同厂商、不同型号、不同虚拟化技术的设备在同一个网络环境下,目前基本是不同厂商自带插件进行各自虚拟机的管理。异构环境无形中增大了虚拟化资源管理难度。
(2)虚拟化后对信息安全的要求增大
虚拟化后,大量的应用、虚拟网络、虚拟主机等资源部署在虚拟环境中,除了各自应用设置相应的安全策略外。对整个虚拟环境的安全考虑不多。当一台物理机器被入侵后,所有虚拟机上面的应用等资源都将受到破坏。所以,虚拟化后对信息安全的要求程度大大增强。
(3)虚拟机无节制蔓延,管理失去控制
企业部署虚拟化技术后,底层硬件与上面运行的软件之间的联系势必被削弱。采用虚拟化技术可以帮助企业降低物理系统的数量,但并不会减少所拥有系统的数量。相反,由于新建一个系统环境的难度和成本大大降低,整个IT环境中的虚拟系统数量可能会急剧增加。如果没有良好的管控,虚拟化会给基础设施管理带来混乱。软、硬件之间的联系被切断,服务器环境变得更不固定、更加复杂。虚拟化可以优化诸如服务配置、补丁分发等流程,但同时也增加了IT专业人员可能没有想到的复杂化。
(4)虚拟机难以管理监控
越来越多的企业开始尝试服务器虚拟化,但同时带来了系统构架日益庞大、业务运行负担不断增加、作业流程越来越难以监控的问题。
(5)虚拟系统的全面管理,是决定虚拟环境成功与否的最重要因素
通过进行有效的资源配置、整合,自动掌握虚拟环境的结构,可以实现物理和虚拟环境的可视化,从而实现对复杂虚拟化环境的高效管理。随时定位一台虚拟机具体运行在哪一台物理服务器上变得非常困难,这就制定需要一个管理方案,不仅可以管理原来的硬件环境,还能统一管理虚拟化环境,为管理人员提供单一视图,用于显示物理和虚拟IT基础设施对其所支持服务的影响。这种统一管理方法能够打通虚拟环境与物理环境的联系,构建端到端服务模型,提供出色的基础设施可视化服务;帮助企业减少故障排除时间并缩短平均修复用时,降低rr成本,同时提高IT服务质量和可预测性。
(6)实施和配置的复杂性
配置复杂可能是虚拟化的主要缺点。建立集群框架、管理主机间的连通性、配置共享存储都不是简单的任务,可能涉及到组织内部多个团队。增加的复杂度很大程度上都是技术性的工作,所以一旦遗漏某些东西,就会影响系统的稳定性。
(7)更新和升级的不利因素
升级到更新版本的产品和硬件组件也可能引发问题。因为虚拟主机集群连接多个系统,各组件之间发生着大量的、复杂的交互。
(8)虚拟环境中的新要求和挑战
虽然虚拟化能从根本上改善管理,但在虚拟环境中管理还面临一些新的挑战。在共享环境中,任何需求波动都能随处感受到。糟糕的管理政策可能引起巨大的连锁反应。
3 虚拟化环境下的IT运维体系总体思路
将基础设施虚拟化资源封装为服务,采用面向服务的方法对服务进行调用。应用业务流程引擎进行资源编排与供应,利用统一配置管理库存储所有服务项信息及关联关系。通过一体化运维监控集中监控所有相关的服务状态,并结合资源编排及供应技术进行自动化故障处理。总体思路如图1所示。
(1)虚拟化资源池的建立,要求尽量对IT系统实行统一分配资源管理;
(2)打破原有各运维资源之间的分割,将原有的竖井结构变为层次结构;
(3)依靠对复杂异构IT资源环境(网络设备、安全设备、服务器、存储、机房环境、操作系统、数据库、中间件、业务系统、IT资产、日常工作、外包管理等)的一体化监(面向业务服务的监视)、管(面向运维流程的管理)、控(面向日常运维的控制),最终达到保障IT基础架构稳定可靠运行、降低系统和业务应用宕机风险、提高运维支持和服务管理效率、优化运维流程、建立绩效体系、控制运维成本、改进决策过程的目标。
4 虚拟化环境下IT运维体系框架
较之原有框架,基于虚拟化的IT运维体系框架(图a)的优势主要体现在:安全管理中心作为体系框架的核心,针对资源池化的特点提供合理的控制与调度,实现资源的统一管理、安全运行。
新的架构分为设备管理层、虚拟化管理层、安全管理中心和运维管控平台四层,主要解决系统的软硬件设备匹配、虚拟资源的控制和调度以及资源间的安全控制问题。
虚拟化环境下的IT框架,以资源管理为中心,兼有原资产管理功能。资产管理主要体现在硬件设备的管理和资产生命周期的管理;而资源管理主要针对虚拟化的资源池特性,实现对虚拟资源的科学管理。
安全管理中心居中,实现对资源池的全面安全管理控制,以及对虚拟资源和资源池的调度管理。
较之原有体系,新的IT运维管理体系有以下区别:
(1)实现了对资源池的安全管理与控制、调度;
(2)安全中心作为运维管理平台与资源池之间的连接纽带,便于安全管理的贯彻与落实;
(3)整合了虚拟化工具管理平台,实现了资源的统一运维管理;
(4)4A系统实现了对维护目标的安全管理与统一操作审计;
(5)运维模式由竖井式变为层次结构,维护人员从维护软、硬件转为主要维护资源池;
(6)系统和应用的部署由人工操作变为模板控制。应用和平台的维护工作可统一由管理员通过模板发布,减少了对集成商和开发人员的依赖;
(7)原有对基础设施的维护分解为物理和虚拟系统的维护。当物理或虚拟设施发生故障时,可动态调用其他虚拟设施替换,降低了发生单点故障的可能性;
(8)对于某些应用内容相近或相同类型数据库的系统,可借助应用专用机、数据库专用机,利用其自带管理软件进行管理;
(9)事件、流程、人员、制度与安全中心并列,形成对资源池的全面管理,强调了制度、流程的约束力。
5 结束语
本文分析了虚拟化发展状况,指出了虚拟化的优、缺点及其对IT运维的挑战,提出了IT运维新体系总体思路和运维框架。
CIO之家 www.ciozj.com 公众号:imciow