网络存储技术新动向盘点
网友 畅享网

在知识经济时代,信息就是企业的财富,数据的重要性日趋突出,企业在存储方面的投资所占比例也越来越高。面对存储市场的巨大需求以及数据爆炸性增长所带来的严峻挑战,全球各大存储供应商无不投入大量资金加紧研发,国内外许多教育、研究机构也纷纷加入其中,所有这些导致各种新方案、新技术、新产品层出不穷。本文就存储技术的最新动向进行介绍。

1.资源整合

1.1 多NAS整合

    由于NAS只能对单个存储设备中的磁盘进行资源整合,难将多个NAS设备整合成一个统一的存储池,因而难以对多个NAS设备进行集中管理[1]。目前,解决这一问题主要是通过构建一种虚拟文件系统,将多个NAS设备上的信息在文件系统层集成,形成一个统一的逻辑视图,以达到资源整合的目的。

    日立研究中心提出并设计了一种可扩展的NAS,它由一个P-NAS(Parent NAS)和多个C-NAS(Child NAS)组成。P-NAS实际上是一个包含多协议虚拟文件系统的NAS设备,X-NAS 则利用MVFS将多个C-NAS虚拟化为一个单一的文件视图。华中科技大学的谢长生等人通过在文件控制服务器中采用一种堆叠式文件系统技术,实现了多个NAS设备的资源整合。

    虽然上述方法解决了部分问题,但仍存在性能瓶颈和单点失效问题。

1.2 NAS和SAN融合

    NAS提供文件 I/O级服务,能够实现异构平台下的文件共享,但其网络协议开销大,不适合对访问速度要求高的应用场合,如数据库应用、在线事务处理等。SAN提供块 I/O级存储服务,具有高性能、高速度等优良特性,但是其管理复杂,不能满足异构平台文件共享等要求。鉴于NAS和SAN具备互补性,二者之间的融合便是一种必然的趋势。目前,实现NAS和SAN融合的方法主要有二种:

    (1)NAS Gateway。采用NAS网关将SAN连接到IP网络,当用户需要访问SAN时,通过NAS网关将文件级访问转换成块级访问。NAS网关具有许多优点,如允许对闲置的SAN进行存储访问,提供SAN存储设备上的异构文件服务,拓展了FC(Fiber Channel)存储设备可以到达的范围,提供NAS的灵活性和容易使用的特性等。

    (2)统一存储。在NAS原有基础上,增加对FCP协议的支持,因此它实际上是NAS到SAN的支持。统一存储的核心是FAS,它是一种采用光纤和网络拓扑结构组成的存储体系。它可以通过光纤交换机,支持企业级的SAN;同时,通过局域网为用户提供文件级数据访问的部门级NAS;另外,通过独立的千兆以太网交换机,可以满足对性能要求较高的应用需求,实现IP SAN。FAS能够同时支持NAS和SAN,实现两种架构上的存储共享,形成单一的存储池,提高磁盘利用率。

2. IP SAN

2.1 FCIP

    FCIP是将FC帧封装到IP数据包中,再通过IP网络传输到另外一个FC的SAN,目的SAN接收到这个IP包后将其解包使其恢复成封装之前的FC帧。通过FCIP协议可以方便地实现两个距离较远的SAN在Internet网络上相互通信。

2.2 iSCSI

    iSCSI是将SCSI协议映射到TCP/IP之上,即将主机的SCSI命令封装成TCP/IP数据包,在IP网络上传输,到达目的节点后,再恢复成封装前的SCSI命令,从而实现SCSI命令在IP网络上的直接、透明传输。目前,iSCSI已被ISO推广为国际标准。

2.3 InfiniBand

    InfiniBand是一种互连技术,它不仅可以用于服务器内部、服务器之间的互连,而且可以用于存储系统的互连,构建InfiniBand SAN(IB SAN)。InfiniBand基于标准的协议,其速度达到10Gb/s甚至更高,性能明显优于FC和Ethernet。InfiniBand支持RDMA零拷贝技术,可以将数据包路由从操作系统转到芯片级,从而节省了CPU的开销。目前,由于TCP/IP网络效率太低导致iSCSI协议没能得到广泛应用,通过iSER(iSCSI Extensions for RDMA)协议可以把iSCSI映射到InfiniBand上,将会大大提高iSCSI的使用。

2.4 Z-SAN

    Z-SAN[2]是IP存储(Storage-over IP, SoIP)技术的实现,它包含两个关键组件:(1)客户端驱动程序。负责解释File I/O命令,并将其转换为Block级的Z-SAN传输指令。(2)网络适配器或。逻辑控制器。负责接收Z-SAN指令,并将其转换为磁盘I/O指令或有效负荷。 Z-SAN有许多优点:将物理磁盘分解为可通过IP进行寻址的虚拟分区,任何PC客户端都可通过IP网络对其进行访问;将IP分区组合为跨区卷、条带化卷、镜像卷和拥有奇偶保护功能的逻辑卷;不使用昂贵的RAID硬件就可以提供其全部功能及性能特征;在块设备上实现了文件和卷共享,允许多用户同时读写文件,提供错误恢复功能;分布式控制器架构可对容量和性能进行顺畅和不受限制的扩展。但Z-SAN利用的是用于连接存储和服务器的一个私有协议,这也是其面临的主要障碍和不足。

3.存储虚拟化

    通常来说,存储虚拟化是指对用户隐藏或屏蔽物理设备的特性,实现对存储系统的透明和集中管理。存储虚拟化有很多优点,如:存储管理的自动化与智能化,提高了存储效率,实现了异构服务器资源共享,消除了对硬件的依赖性,减少了备份与恢复的复杂性等。目前,存储虚拟化技术已经渗透到存储系统的各个层次。根据虚拟层所处的位置,可以分为三种方式:基于存储设备的虚拟存储,基于服务器端的虚拟存储以及基于网络的虚拟存储[3]。

    (1)基于存储设备的虚拟存储将虚拟层放在存储设备的适配器、控制器上来实现,它充分考虑存储设备的物理特性,将服务器从虚拟化存储的实现工作中彻底解放出来,直接在存储设备上实现,减轻了主机的开销。从简单化和性能考虑,这种方案最佳。但是,由于虚拟层在存储设备上,其实现因存储设备而异,难以在一个存储网络中实现无缝连接。

    (2)基于服务器端的虚拟存储将虚拟化软件驻留在应用服务器上,通过改造操作系统、内嵌软件模块来完成映射工作。这种方式不需要增加任何附加硬件,设备成本最低,也最容易实现。但系统可靠性差,一旦出现服务器单点故障,将影响整个存储系统的数据完整性。

    (3)基于网络的虚拟存储位于主机和存储之间的网络设备上,它既不依赖于特定的逻辑卷的表示方式,也不依赖于特定的操作系统,是一种最开放的环境,能够兼容各种服务器、操作系统以及存储设备,也是目前存储虚拟化的主流技术。

    笔者认为,基于智能交换机的实现方式将是构建下一代虚拟化存储平台的最佳方案。

4. 存储集群

    数量众多的计算节点、高并发的数据访问给存储系统带来了极大的压力,要求存储系统可以满足聚合高效率、高带宽的数据访问需求,这直接推动了集群存储技术的发展。集群可以支持大规模数据的有效传输更为重要地是,集群还可以有效解决当前存储系统中普遍存在的服务器性能瓶颈和单点失效问题。目前,存储集群主要是通过集群文件系统的方式进行实现。

    (1)DAFS (Direct Access File System)是一种文件访问协议,能够实现客户端与存储设备之间的文件数据直接传输,可以在大量甚至过量负载时,有效减轻存储服务器的计算压力,提高存储系统的性能。DAFS是为集群、共享文件的网络环境优化设计的,它利用VI(Virtual Interface)和InfiniBand技术,为NAS集群提供高可靠、低延时的连接。DAFS可以消除单个NAS设备的伸缩性方面的局限和管理问题,并使得NAS能够提供事务处理系统所要求的性能和可靠性。目前,已有用DAFS构建NAS集群的存储系统,效果良好。

    (2)Lustre(Linux Cluster)来源于卡耐基梅隆大学的Coda项目研究工作,为满足Linux集群对存储系统高性能和数据共享的需求而设计。Lustre是一个全局文件系统,它由客户端、存储服务器和元数据服务器三个主要部分组成。客户端可以透明地访问集群文件系统中的数据,而无需知道这些数据的实际存储位置,存储服务器负责实际文件系统的读写操作以及存储设备的连接,元数据服务器负责文件系统目录结构、文件权限和文件的扩展属性以及维护整个文件系统的数据一致性和响应客户端的请求。

    (3)蓝鲸集群文件系统[4]是中科院技术研究所自主设计的用于海量网络存储系统的集群文件系统,为大规模计算节点提供共享的、单一映像的数据访问服务。它采用专用服务器模式,有效分离了文件访问的控制流和数据流,为Windows和Linux客户端提供高I/O吞吐率和高扩展能力的数据访问。它采用灵活有效的机制管理系统存储资源,并支持存储系统的扩展,适合于构建大容量、高I/O吞吐率和高扩展能力的网络存储系统,能够满足高性能计算、数据分析、系统仿真计算等多种应用的需求。

5.智能存储

    智能存储最先由美国先进信息公司(ADIC)提出,其核心理念是“对应用系统和用户透明”。这就要求存储系统自身应该具备某种智能,用以解决异构系统互操作性、可靠性、可扩展性以及安全性等问题,最大限度地减轻服务器处理数据访问请求的负担。 UC Berkeley大学正在研究智能存储系统(Intelligent Storage, ISTORE),旨在从可用性、可维护性和自进化性方面改进海量存储系统的性能,达到智能存储和智能管理目的。ISTORE使用专用的智能硬件和软件来构造海量的存储系统。其硬件主要由智能存储设备砖(Intelligent Device Brick, IDB)和智能底盘(Intelligent Chassis, IC)组成。IDB由磁盘、快速嵌入式CPU、内存和网络接口构成;IC是可扩展、可冗余的,由快速网络和UPS组成。目前,ISTORE项目正在研究把AME(Availability、Management、Evolutionary)带入大规模、密集型存储系统中,从而实现存储智能化和管理自动化。

    最近,笔者提出了一种“智能网络磁盘集群存储系统”(Intelligent Network Disk Cluster Storage System, INDCSS)的存储方案[5]。INDCSS采用开放式体系结构,充分利用现有网络,将将多个相互独立的同构型智能网络磁盘存储节点虚拟为一个超大容量、集中化的数据存储中心。INDCSS的核心是一个被称为“智能网络磁盘(IND)”的存储设备,它包含一个虚拟文件系统(IND Virtual File System, INDVFS)和IND Manager管理工具。INDVFS将各个存储节点上的文件信息组织在一起,对外提供一个统一的用户视图和访问接口,而内部结构对用户完全透明。同时,由于能够兼容CIFS和NFS文件系统,因此可以实现Windows/Unix (Linux) 异构平台下的文件共享。IND Manager提供在线配置、自动负载均衡、文件迁移以及数据备份与恢复等功能。INDSS基于Linux集群架构设计,彻底抛弃了文件/元数据服务器方式,客户端不再通过集中的服务器去进行数据访问,有效消除了性能瓶颈和单点故障。INDCSS可扩展性好,可以在不停机的情况下增加或更换存储节点,以扩展系统存储容量和增强系统处理能力,且性能不会受到影响。

    目前,在智能存储方面,存储网络工业委员会(SNIA)已在推行和完善主动存储管理规范(Storage Management Initiative-Specification, SMI-S),旨在对存储网络的管理提供一个统一的标准,实现主动的存储管理。SMI-S标准的基础是Bluefin规范,它是一套由多厂商联合提交的基于对象的API,其目标是将存储管理软件和各种存储设备在该API上统一,用来统一主动发现、监控和管理来自不同厂商的存储设备。

6.结束语

    信息资源的爆炸性增长,给存储系统带来了极大的压力,如何有效存储和管理海量数据信息是存储技术所面临的严峻挑战。资源整合、IP SAN、存储虚拟化、存储集群以及智能存储引领网络存储技术发展的最新潮流,给解决这些问题带来了新的契机,这些新技术必将有力地推动存储系统朝着更加智能化的方向发展。

 

CIO之家 www.ciozj.com 公众号:imciow
关联的文档
也许您喜欢