在vSphere环境中,管理员使用SSD可以提升工作负载的性能,但是,你要知道你工作负载的需求,以防支出浪费。
SSD正在改变存储。它们的低延迟、高吞吐量、价格适中结合在一起,使用SSD作为前端更大的缓存产生了一系列解决方案,这种便宜但是较慢。
SSD的一个最大特征就是,它们的读写速度可以在几十微妙内,比普通硬盘要快个几百倍。这种低延迟让SSD成为很棒的缓存技术。
SSD仍是一个昂贵的选择
虽然价格持续下跌,SSD以低延迟、高吞吐量,以每千兆字节为单位仍是一个高价格。如何经济高效地使用这种昂贵类别的存储,需要你拥有工作负载的知识。重要的是要有足够的昂贵的缓存来支持应用程序性能。如果一个较大的缓存不能够提供改进应用程序的性能的话,那就是浪费金钱。真正的问题是有几个工具能够用于识别你的应用程序的磁盘缓存大小。
在存储历史上,大多数存储阵列都是使用硬盘作为存储容量,将大量的硬盘和一些提高性能的RAM进行组合。最近,我们看到了一个新兴的经济型的全闪存存储阵列——阵列里无硬盘——比同等价格的磁盘存储提供更高的性能。这向许多客户近年购买的磁盘存储发起了挑战。
从阵列中获取最大利润
存储阵列的购买周期较长,一般都是3-5年。客户想以更经济的方式从他们的磁盘阵列上获得更好的性能,这样他们就可以避免过早的替代。磁盘阵列供应商添加SSD作为他们的磁盘阵列的性能层的缓存,以增加可用的RAM。在性能层访问数据要比在磁盘层访问数据快的多。在你的存储阵列上调整SSD缓存和RAM的大小是优化存储的一门新艺术。
中央缓存的概念就是指工作集的大小。应用程序通常访问他们的一小部分数据要比访问其他剩余部分数据要频繁的多得多。想要理解这一点,要把它想象成一本百科全书:阅读每个页面的索引要比阅读其他任何页多上几百倍。有个全面的索引可得到上百倍的提升将会收益颇丰。而其他剩余页可得到上百倍的提升则收益很少。
在存储阵列中对象大致是相同的。一小部分数据,被称为热点数据,也就是比其他数据访问更频繁的数据。缓存真正的好处,只有当我们有足够的容量来容纳所有访问频繁的页面时才能体现出来。假如有10页热点数据,而缓存只能容纳5页,那么我们就必须等待在较慢的介质上检索其他5页。有足够的缓存来保存一些正常的页面将会有所帮助,但是比不上缓存索引的速度。
计算合适的缓存大小
当SSD高速缓存能够支撑设置的应用程序数据工作集是才最有价值。不能为工作集提供足够的SSD将不能提供最佳的性能。假如一个应用程序有500GB数据。如果应用程序的I/O为40%,仅使用20GB数据,那么显然有一个20GB的缓存将会得到一个很好的改善。使40%的I/O提高百倍也是一个不错的选择。
那么如果是100GB的缓存是否能提供更好的性能呢?有可能,但也不一定。也许应用程序下一个40%的I/O将传输200GB上下的数据。然而增加到100GB将不会提供与第一次20GB同样水平的改善。额外的80GB缓存可能会加速只有15%的应用程序的I/O,将会花费最初改善四倍的成本。
挑战热点数据
最大的挑战是热点数据量难以衡量。甚至对于特定的应用程序类型,不同用途的应用程序——不同的用户——将会有不同的概要文件。
热点也有多个层次。那个百科全书,目录表很小但使用要比索引多。而索引很大而且在所有页面都设置很大。如果有一系列大量的缓存那些将会得到帮助;若缓存越大,有一系列层次的性能将会提升越多。也有一系列同层次的不随缓存的增大而提高性能。如果你的性能层是SSD,非常昂贵,那么你需要衡量你的工作负载,按你的工作量进行适量购买。
CIO之家 www.ciozj.com 公众号:imciow