您好, 访客   登录/注册

存储虚拟化技术的归宿

来源:用户上传      作者: 卜庆忠

  本文介绍了存储虚拟化的现有及未来的技术理念,并通过介绍国外一些先进体系对存储的技术研究及应用状况给读者提供了很好的借鉴。
  网络存储的目标市场现状,为存储虚拟化提供了发展机遇,同时也带来了技术方面和非技术方面的挑战。在以数字化为主要方向的信息化发展过程中,信息容量的快速增长,给参与社会活动的各个部门,都或多或少地带来了管理成本和设备投入的增加,而这么巨大的数据增长牵扯到电力、存储空间、管理等一系列复杂问题。由此,对存储虚拟化未来技术的发展要求越来越高。
  
  存储网格
  
  自从网格思想产生之初,人们就常以电力网为例来类比网格的思想和现实形态,这无疑是一种较为现实的、易于理解的类比方式,也道出了网格的很多本质特性,自治性(机制)和共享性(机制)是人们关注网格的最主要原因。但不得不提的是,作为一个系统网格必须是可控的,这一点在现实的电力网中也是如此。同时,网格也必须是可测量的、安全的,这几点是作为现实可行的技术所必须具备的条件,而正是这几点对网格的发展,构成了很大的障碍,原因是到目前为止,在这些方面的理论和技术准备并不充分。
  存储网格是实现存储资源自主、有序、合理“流动”的系统,由存储网格软件所构成的存储资源的势能评价体系(内存“脏”页的标记就是一种简单的评价)为存储资源的调配提供了可实时决策的依据。存储资源是一种概念抽象,它既可能包含了类似Cache这样易失特性的存储介质,也可能包含了磁盘存储、磁带存储这样的非易失性存储,而光盘存储也是可以涵盖在其中的,那么应该如何理解存储资源的“流动”呢,存储资源的“流动”表现为由存储网格软件所评价出的存储资源对象的特性与数据对象的匹配过程,例如: 数据对象的重要性或安全性需求降低后,原来用来保存该数据对象的存储资源对象将不适合,那么也就产生了数据对象迁移的需求,而存储网格可以按照一定的规则实现这一自动的迁移过程,从而产生了存储资源的“流动”(由此也可以看出这种所谓的“流动”有如电流和电荷的关系一样,是一种相对的概念,是一种理论抽象的结果)。存储网格中实现共享和自治机制的存储网格软件,以及实现存储对象与数据对象匹配的操作等等是存储网格的技术支撑,而这些软件所依托的理论和实现模型,以及对象(包括存储资源对象、数据对象、系统资源对象等)的概念抽象是存储网格的核心之所在。
  目前,存储网格被理解为多种多样的形式,但多片面地强调其某一个侧面,而忽略了其内在规律性,无论是将存储网格描述为全交换或全联通的网络拓扑结构,还是强调它所带来的灵活性、安全性、互操作性等等,包括P2P技术,这都是存储网格的外在表现或实现层面的局部特征,而构成存储网格的核心思想并不在于此。
  存储网格从思想到实现并不存在半点玄妙的东西,它所想表达的思想和技术是人们习以为常的众多自然、物理规律,乃至社会规律在计算机系统构成中的自然延伸,存储网格将是人们尊重规律来发展技术的必然选择。而就存储虚拟化这一论题而言,存储网格与其并不在一个层面上,但从广义上讲存储网格是存储虚拟化技术的归宿之一。
  
  以数据为核心的存储
  
  随着人们对信息需求的不断增长,数据量呈现不断激增的态势,其直接表现是社会各单位对于存储资源的需求量也越来越大,而随着整个社会对信息的依存度的不断提高,信息载体――数据的重要性也随之得到提升。由此也促使着人们的管理理念正从以计算为核心、以存储为核心逐步转向以数据为核心,随着数据存储容量和数据服务种类的增加,如何更为合理、有效地保证数据服务质量的问题便愈显突出,但目前的解决方式还是在单一HSM的配置下,对所有的数据服务均配以相同质量的存储服务,或者人为地针对不同数据服务要求设定存储服务质量,例如ILM管理理念指导下的方法,但这些都不是从根本上给出解决这一问题的方法。
  
  现有的存储构成理念
  
  从网络存储设备及接口方面考虑,卡耐基梅隆大学(Carnegie-Mellon University或CMU)还在研究和标准化NASD(Network Attached Secure Disk); 从智能化磁盘设备方面,国外已有一些相关研究。从国内来看,网络存储方向的新技术研究相对较少。
  ● NASD
  CMU的NASD是一个较早提出的磁盘系统。美国国家存储工业委员会NSIC(National Storage Industry Consortium)提出的OSD(Object-Based Storage Device)模型就是基于NASD。
  这些系统的研究重点是存储设备的功能及其接口协议。NASD提供给用户的不是磁盘块接口,而是磁盘对象接口。在多数情况下,磁盘对象都是对应文件。一个磁盘对象可以有许多由磁盘系统管理的属性,其中包括大小、各种时间等。
  ● 活跃磁盘设备(Active Disk)
  卡耐基梅隆大学和加州大学的Santa Barbara分校与马里兰大学(Maryland University)分别进行了活跃磁盘相关的研究项目。
  两个关于活跃磁盘的研究项目都是利用磁盘内部的CPU和内存资源。随着硬件技术及磁盘技术的发展,磁盘内部的CPU及内存资源越来越丰富。近几年,服务器所使用磁盘内部的嵌入式CPU可达到200 MIPS的处理能力,而内存容量也相应地可达到32MB~64MB。活跃磁盘的这两个研究项目就是研究和设计一个分布式的系统结构,使得应用程序的一部分可以动态地下载到磁盘中去并在磁盘的运行环境中执行。其结果不仅充分地利用了磁盘的处理能力,还大大降低了存储容量的增长速度与CPU处理能力的增长速度之间的差异。与此同时,由于磁盘内嵌入式CPU的有效使用,也大大降低了对于I/O带宽的要求。
  ● 智能磁盘设备(Intelligent Disk)
  在活跃磁盘研究项目的基础上,加州大学的伯克利分校开始了智能磁盘设备的研究。与活跃磁盘不同,智能磁盘对于磁盘的CPU能力、内存容量、磁盘间的通讯带宽都有更高的要求。与此相应,智能磁盘除了针对数据库、决策支持系统之外,还面向更为广泛的应用,其中包括降低数据写延迟、软件RAID的实现、系统自动配置等。
  在智能磁盘的研究中,还有许多问题并未能够解决。例如,智能磁盘的软件系统结构,及智能磁盘的操作系统所应提供的服务等。
  ● 自省存储设备(Introspective Storage for Data-Intensive Network Services)
  与前面几个研究项目类似,加州大学的伯克利分校所进行的自省存储设备项目也是在充分意识到存储容量的增长与CPU处理能力的增长之间的差异,基于嵌入式CPU技术的发展和普及所设计的一种新型智能存储系统结构。与以上的研究不同,处理除了试图解决系统的性能和可扩展性外,该项目的研究焦点更集中在系统的高可用及自我管理和维护功能方面。
  在这个系统结构中,I/O设备,特别是存储设备,都具有智能处理能力,并且成为系统的最为基本的子系统。从硬件构成方面,自省系统是以I/O为核心,所有的设备都是标准的、可互换的,通过智能机箱与网络相连,从而构成完整系统。软件系统的系统结构主要支持各种的系统检测和相应处理能力的需求,并且系统能够自动生成常用的检测和处理程序。该项目已衍变为另一个研究领域: ROC(Recovery Oriented Computing)。
  上述研究的重点更多地还是关注于系统的计算能力,I/O是所有优化的核心,但从中也可以看到有些研究开始关注于应用的特性,如上述的活跃磁盘设备和智能磁盘设备。
  
  以数据为核心
  
  计算系统存在的价值在于它能够实现数据处理功能,计算系统是一种重要的、难以替代的工具,但无论怎样,数据才是最终的核心所在,在以数据为核心的理念指导下,存储系统构建的思想也必然应该进行相应的调整。
  以数据为核心首先关注的是存储如何更好地表达和体现数据对象的特性,从这一观察角度来看,适应数据对象特性的变化,存储结构必然是对象化的,HSM和ILM仅是一些特例的实现手段,而存储的性能(带宽、缓存等)、存储的效能(造价、能耗)、存储的安全性(有无单点故障、是否支持冗余)等等都是描述存储对象所应考虑的重点,这将是存储虚拟化未来发展的重要方向之一。
  
  链接:现有存储理念存在的问题
  
  HSM是在以计算为中心的历史条件下,由IBM首先提出的一种存储管理结构。为了更好地适应计算能力的发展速度,计算机系统的构成必须将存储部件按照与计算部件的交互关系有层次地连接,与计算部件直接交互的为读写速度最快的存储部件,其它间接交互的存储部件的读写速度次之,依次形成了一级Cache、二级Cache、内存以及磁盘设备或磁带设备这样一个分层的存储管理结构,这种构成的主要出发点是为了使存储能力适应计算能力。
  ILM(信息生命周期管理)是二十世纪九十年代产生的一种以合理使用存储资源为目标的理念,它之所以没有能够像HSM一样在存储系统结构方面产生较大的影响,原因在于人们对于存储系统的理解普遍认识是,存储系统是计算机系统中最不活跃的成分,它受硬件构成等因素的影响无法实现自主灵活性。因此,ILM仅停留在管理理念的层面上,而具体体现在数据管理功能上,对存储系统的需求是对多介质存储系统的统一管理。


转载注明来源:https://www.xzbu.com/8/view-1076981.htm