云架构中数据冗余度问题研究
刘清利 郭振 网络
1 引言

随着科学技术的进步,IT行业所在的环境复杂性与日俱增,更多的IT预算被用于维护基础架构和维持应用程序的正常运行,而不是更好地满足客户的需要。云的出现似乎给人们带来了新的希望,于是有人做出这样的预测——未来云时代。

2 云架构体系设计

2.1 云架构的概念及特点

云架构这一概念是Google在2006年首次提出的,它是为满足按需分配的服务而设计的软件架构。云架构与我们所熟悉的传统计算机体系不同,云架构是一个层结构,整个云架构层分为显示层、中间层、基础设施层和管理层四个层次。显示层主要用于向用户显示所需的内容,并且利用HTML、JavaSeript、CSS和Flash等云技术中间件层为用户提供更多的服务。中间层起着过渡作用,它不但为显示层提供支撑性服务,也可以为基础设施层提供资源上的便利,还可以为用户直接使用。中间层主要通过5种云技术实现:REST、多租户、并行处理、应用服务器和分布式缓存。管理层则是为上面三个层服务的,它提供账号管理、SLA监控、安全管理等技术,目的在于更全面地管理和维护三个横向层的稳定。通过上述分析,整个云架构层可用如下框架来表示(见图1):

 

图1 云架构层

云架构的特点是建立在云架构层的基础上的,它具有如下特点:

(1)规模大。“云”系统涵盖大规模的容量,例如IBM、微软、苹果等的“云”具有成千上万台服务器运行,“云”的计算能力和数据容量是一般计算机技术不能媲美的。

(2)数据安全性强。云架构层中的管理层对数据、帐号等资源监控和保护,使其免受不必要的侵害;而且管理层可以凭借自身的服务功能应对横向3个层的突发情况,因此云架构中储存的数据是相当安全的。

(3)普适性强。云架构受“云”的支撑,可以对变幻莫测的应用加以控制,一个“云”就可以掌控多种不同的应用程序。(4)伸缩性强。云架构可以根据用户的需要随时改变其最佳容量,达到最优状态。

2.2 云架构的设计

要实现“云”的强大功能,前提是必须要有完整的云架构体系。云架构是一种计算模式架构,它通过“云”把资源、数据和应用等以服务形式提供到用户端。基于前人的研究,云架构主要包括服务控制机群、存储节点机群、计算节点机群、应用节点机群、输入和输出设备这六大部分。前面分析了云架构层的结构,于是可以根据云架构层进行拓展,对整个云架构体系具体设计(见图2)。

 

3 云架构中冗余度的处理

冗余度就是指数据的重复度,计算机系统中数据的重复存贮称为数据冗余。数据冗余不但对数据库的完整带来影响,还会浪费存储系统资源。尽可能地降低数据冗余度,是云架构设计的主要目标之一。与关系模式的规范化理论一样,计算机系统处理冗余问题的主要思想就是最小冗余原则。

云计算框架可以更好的管理存储空间,利用云计算的数据冗余处理机制,把数据资料分成若干文件片,分别存储在云层中不同的数据存储设备上,如果有存储设备出现异常,也不会影响到存储资料的完整性。云层中采用节点提取文件特征值,减少数据的重复性,在云层中创建了数据冗余的信息厍。

如图2所示,云架构中存在冗余策略,表明在云架构存储中可能存在大量的数据冗余。由于有些关联数据可能需要重复存储,而降低相同数据的储存量,使关联范式达到最优化,是未来云架构所走的毕竟之路。关联数据的局限性体现在数据重复存储,从而产生冗余,加大了云架构的计算量,不仅浪费了存储空间,也减慢了计算机的运行速度。处理能力的受限性表现在对简单信息搜索、对复杂信息屏蔽以及动态信息混乱等。由于产生了数据冗余,使得计算机系统运行速度慢、维护难,达不到顾客的要求,满足不了客户的需要。

由于云存储服务都采用了分布式数据存储方式,通过将冗余数据分散存储在连入云系统的大量存储设备中去,以提高系统的抗摧毁性。在云架构中主要存在副本备份冗余,对于其备份可使用存储文件的不同之处,减少其存储量,处理好云架构中的数据冗余,节省资源,达到系统最优存储。

4 结语

处理好云架构的冗余度,能够通过最少的投入得到最多的回报。未来将是云的一个时代,云架构的搭建和运行逐渐兴起,它提高了计算的效率,最大限度的减少了数据的重复性,并能够有效及时的处理信息,从而能够未雨绸缪。

CIO之家 www.ciozj.com 公众号:imciow
关联的文档
也许您喜欢