浅谈企业数据中心的存储性能优化
徐彦春 万方数据 |
随着经济全球化和信息国际化,信息技术逐渐成为了企业改进作业流程、降低成本、提高竞争力的强有力手段。信息化的建设中心总是围绕着应用的交付和数据中心的建设两个方面。近年,连云港港先后建成使用了二十余个大型信息系统:集装箱管理系统、散杂货公司调度与商务系统、港口货源信息系统、港口计划统计系统、港口物资管理系统,港口计件工资系统、港口机电设备管理系统、港口海关监管系统、港口主题数据库、港口信息门户网站、港口船舶调度系统以及轮驳公司与引航公司等衍生系统、港口边检业务网上受理系统,,港口理货业务管理系统等近二十余个系统。这些系统已经基本成为港口集团各单位支捧业务运作的核心系统,也给连云港港口带来了实实在在的经济效益和社会效益。
应用系统的普及让我们对信息系统的依赖程度空前增强,不得不去考虑数据的安全存储、数据的备份、数据的深度挖掘等内容,服务性能的优化、从一般意义上的佶息中心向企业数据中心的转变直接摆在我们的面前。
 2、需求分析

  现在,各大中企业都在兴建信息中心。开始时都有比较好的规划,但随着企业发展,业务的要求随市场变化,对信息中心的要求也不停的变化,当经过几个时期建设时,信息中心很可能成为短期应对项目而建设,造成各自为政,迷失了规划的方向。常见的现象是:各个系统独立,那个部分不足就升级或更换更强的设备。实际上,这样的做法是非常浪费的。

 

 
信息中心主要包含接入设备、服务器、数据库和应用系统、网络设备、存储、安全和信息系统管理设备等,是一个整体系统,投资建设时就应该考虑到整体性和灵活适应性。我们来看看几个方面。

  一般我们会给每个应用系统分配独立的服务器,若这个应用非常重要,那我们就会配置两台傲冗余。随着业务发展,使用人数越来越多,但台服务器性能无法满足时,我们会考虑用更强壮的服务器。若某些应用使用比较少,或者偶尔性能要求比较高,基于兼容性、可维护的角度考虑,我们依然要配置一个单独的服务器。随着系统越来越多,信息中心的服务器数量越来越多,几十上百的服务器随处可见。大量的服务器利用率其实不高,但依然一样的耗电,一样的需要维护和管理,一样的需要花钱维保。解决这砦问题的方法基本由两个:服务器整合和服务器集群。

  服务器整合是指把几台利用率不高的,或者是出现错时高蜂的服务器整合到一台服务器上,以提高单台服务器的利用率。因整合带来服务器数量的大幅减少,同时降低运营费用。这个领域最具代表性的是VMware。这种方法能解决部分问题,但若同种应用或具有同样峰值要求的环境VMware就无法解决。这时,我们可以用服务器集群来解决。服务器集群是上个世纪90年代就开始发展的,有硬件也有软件的模式,发展到后来,硬件模式的简单可管理和不影响原服务器性能等优点占了主流,最具代表性的有F5等,可以有30多种的负载均衡算法支持,并且可以随需自动变换。

  服务器端相对比较独立,容易解决。而服务器后端相对就比较复杂,包括数据库、存储等,而且还需要互相配合才能达到最优。比如数据库系统存储空间分配方面,最频繁读写的是Redo Log和tmp临时空间,而实际的Data可能对性能的要求没有这么高,所以我们需要把最优性能的存储空间分配给它们,才能达到整体较优。如下图标红的表明是读写最高的数据块,实际只占很少一部分,但我们把两个RedoLog放在同一组存储空间中时,一定会出现资源争用。从而影响两个数据库的性能。

  3、存储优化的方法

  那如何合理规划分配存储,达到性能最优化呢?我们来看看几个基本方面:磁盘阵列柜内优化、存储性能监控调优、结构调整。

  柜内优化可以从几个方面进行。最先可以考虑的是升级盘阵操作系统(微码),用最新的版本来达到较优的性能。其次可以考虑硬盘方面。按照磁盘RAID的特性,不同类型的RAID类型会有不用的性能表现,如RAID0就比RAID5性能要好,只是总体可用容量少了。同是RAID5也有性能差异,按照每个厂商的不同,,一般到十几个硬盘的情况下性能达到最佳。

  几乎所有的盘阵都会配置大量的缓存,缓存的读写分配也会影响性能。针对不同的应用特性我们需要分配不同多少的缓存。

  有些极端的性能要求的,还可以使用企业级的闪盘(FlashDisk)来支持。企业级闪盘有非常优异的性能特点,比如读写IO比磁记录硬盘高几十倍,同时随着IO的增多,响应延时几乎保持稳定。详见右图,可以看出,随着IO数量到一定值,由高性能光纤硬盘组成的RAID组响应的时间急剧上升,而闪存盘则保持几个毫秒响应时间的优美特性。

 

对于纯粹的性能来讲,上述方法都是有效的,但在众多应用系统中,企业占到最多资源的很有可能不是核心业务,也即非核心业务很有可能和核心业务同台竞技,争抢资源。这样就造成核心业务响应比较慢,即使升级到较高一级的设备也没有明显效果。在网络领域是用QoS来解决的,在存储中是否也有这样的工具呢?个别厂商已经考虑了这些需求,比如EMC,在中端盘阵CLARiiON系列中就可以选择NQM(Navisphere Quality of Service Manager)软件来监控和调配性能使用,保证主要的性能分配给核心的业务。这些调配可以按照吞吐量,带宽、响应时间等参数来设置。

  另外一个需要考虑的是服务器和存储之间连接的性能问题。若存储性能足够,服务器性能也很好,很有可能连接它们的链路是个瓶颈。我们需要配备链路冗余等软件来达到多条线路负载均衡,消除瓶颈。

  除了上述局部的性能调优外,还有其他策略性的调优方法。比如一个企业,总有敬据量约IOTB,包括0LTP的数据库应用数据、Email数据、文件共享数据等。这个企业采购lOTB容量的盘阵,所有数据都放在一个盘阵中。实际大多效企业的数据经常使用的只占20%。那也就意味着不大用的80%的数据影响了整个盘阵的性能。尤其是需要对数据进行保护时,花在备份不常用数据的时间比常用数据长4倍。所以,我们会考虑把不常用的部分数据移出主要存储设备,放到比较稳固的存储设备上,比如EMC的Centera,需要的时候可以直接访问,即不影响访问的便利性。又可以给主存储设备瘦身而达到性能的提高。

  结语

  综上所述,我们应该整体综合考虑,以合理的规划和局部调优相结合,才能既满足业务需要,同时又充分有效的利用已有设备,综台提高企业数据中心服务的性能和水平。

CIO之家 www.ciozj.com 公众号:imciow
关联的文档
也许您喜欢