您好, 访客   登录/注册

云计算在互联网中的发展趋势

来源:用户上传      作者: 武振兴

   [摘要] 云计算是一个虚拟的计算资源池,它通过互联网提供给用户使用资源池内的计算资源。作为一种最能体现互联网精神的计算模型,云计算必将在不远的将来展示出强大的生命力,并将从多个方面改变我们的工作和生活。
  [关键词] 云计算 蓝云计算 虚拟化技术 分布式计算系统
  
  在最早涉及网络的计算机课程的多数教材中,只要涉及Internet这个关键词的时候,一定是用一朵云来表示。这朵云表现的不仅仅是在互联网的那一端有着庞大的计算能力,而这朵云背后还隐含了更深一层的含义,它无疑表达了互联网后端复杂的计算结构和庞大的联结体系。
  在2l世纪初期,正当互联网泡沫破碎之际,web2.0的兴起,让网络迎来了一个新的发展高峰期。在web2.0的时代,Flickr、MySpace、YouTube等网站的访问量,已经远远超过传统门户网站。用户数量多以及用户参与程度高,是这些网站的特点。因此,如何有效地为如此巨大的用户群体服务,让他们参与时能够享受方便、快捷的服务,成为这些网站不得不解决的一个问题。正是因为一方对计算能力的需求,而另一方能够提供这样的计算能力,于是云计算就应运而生。事实上,云计算不能算是一个全新的概念,但是,它却将是一项颠覆性的技术:云计算是一个虚拟的计算资源池,它通过互联网提供给用户使用资源池内的计算资源;完整的云计算是一整个动态的计算体系,提供托管的应用程序环境,能够动态部署、动态分配/重分配计算资源、实时监控资源使用情况。云计算通常具有一个分布式的基础设施,并能够对这个分布式系统进行实时监控,以达到高效使用的目的。
  谷歌全球大中华区总裁李开复博士这样界定云计算:所谓云计算。就是要以公开的标准和服务为基础,以互联网为中心,提供安全、快速、便捷的数据存储和网络计算服务,让互联网这片“云”成为每一个网民的资料中心和计算中心。也就是说,在谷歌理念的云计算模式中,用户所需的应用程序并不运行在用户的个人计算机、手机等终端设备上。而是运行在互联网上大规模的服务器集群中。用户所处理的数据也并不存储在本地,而是保存在互联网上的资料中心里。提供云计算服务的企业负责管理和维护这些数据中心的正常运转,保证足够强的计算能力和足够大的存储空间可供用户使用。而用户只需要在任何时间、任何地点,用任何可以连接至互联网的终端设备访问这些服务即可。“谷歌提供的网络搜索功能本身,就是一种典型的云计算。其它谷歌服务,诸如Gmail、Google Docs、GooSe Picasa Web等,无不充分体现了云计算的强大力量。”
  如果说Google、Microsoft等是以提供云计算服务为主,那么,与Google不同的是,IBM并没有基于云计算提供外部可访问的网络应用程序,而是架构云计算平台。IBM在2007年11月15日推出了蓝云计算平台,能够帮助用户进行云计算环境的搭建。它通过将Tivoli、DB2、WebSphere与硬件产品(目前是x86刀片服务器)集成,能够为企业架设一个分布式、可全球访问的资源结构。“蓝云”建立在IBM大规模计算领域的专业技术基础上,基于由IBM软件、系统技术和服务支持的开放标准和开源软件。简单地说。“蓝云”基于IBM Almaden研究中心(Almaden Research Center)的云基础架构。包括Xen和PowerVM虚拟化、Linux操作系统映像以及Hadoop文件系统与并行构建。蓝云计算平台由一个数据中心:IBM Tivoli部署管理软件(Tivoli Provisioning Manager)、IBM Tivoli监控软件(IBM Tivoli Monitoring)、IBM WebSphere应用服务器、IBM DB2数据库以及一些虚拟化的组件共同组成,所有的请求都由web2.0组件来处理。然后转发到Tivoli配置管理器,进行服务器的分配或解除分配。蓝云计算平台中的存储体系结构对于云计算来说也是非常重要的,无论是操作系统、服务程序还是用户应用程序的数据都保存在存储体系中。
  目前,谷歌已经与中国大学建立学术合作项目,清华大学是内地首所参与该项计划的高校,其与谷歌合作开设了“大规模数据处理”课程。GooSe资深软件工程师谷雪梅认为。这些课程能够让学生更加感性地认识云计算的本质,并利用云计算的平台。引发自己的想法。但是,如果用户想写云计算的运用。依然存在门槛,不仅需要计算机背景,还需要连接到谷歌的数据中心,而普通学习者暂时还没有这个能力。可见,云计算运用的开发不是普通学习者可以掌握的,但是,有意识地运用已开发的云计算服务,不但是在学习效果上有明显地提高,有助于完善网络学习环境构建。同时也是一种思维更开放的转变。
  我们分析一下Google的云计算案例:Google需要处理的海量数据和复杂计算,都可以通过架构在Linux集群之上的云计算平台得以实现。Google的三大核心技术构成了实现云计算服务的基础:GFS(Google文件系统)、MapReduce(分布式计算系统)、BigTable(分布式存储系统)。
  GFS位于这三项技术的最底层,负责许多服务器、机器数据存储工作。它将一个大体积数据(通常在百兆甚至千兆级别)分隔成数据大小的数据块,放到两到三个服务器上。这样做的目的是当一个服务器发生故障时,可以将数据迅速从另外一个服务器上恢复过来。在一定程度上,在存储层面,机器故障的处理由Google文件系统来完成。
  GFS是一个可扩展、结构化、具备日志的分布式文件系统,支持大型、分布式大数据量的读写操作。在文件系统之中,针对上述特定的数据特点进行了性能优化,并且GFS在设计上有很强的鲁棒性,在数据容错性方面表现优良。
  第二个部分就是MapReduce,它是Google开发的c++编程工具,用于大于1TB数据的大规模数据集并行运算。MapReduce的出现将开发者所关注的业务逻辑与分布式计算涉及到的复杂细节划分开来,让并行应用开发通过MapReduce提供了编程模型屏蔽底层实现细节,以服务于Google内部绝大多数数据处理业务。并行应用在执行过程中,输入数据的划分、节点业务执行条度、容错处理以及节点间信息交换等细节都将由MapReduce提供的编程模型实现,极大简化程序员开发大规模数据处理计算的过程,让并不具备并行和分布式系统开发经验的程序员免除底层细节的羁绊,专注于业务逻辑实现。通过MapReduce所提供的编程模型,可以将许多真实世界的计算任务抽象后使用分治规约的方法实现。一个基于MapReduce的简单并行处理程序可能仅仅需要几十行代码就可以完成复杂的分布式计算工作。
  第三个部分BigTable,作为Google一种对于半结构化数据进行分布存储与反问的接口或服务,它是建立在GFS和MapReduce之上的结构化分布式存储系统,可以帮助Google最大限度利用已有的数据存储能力和计算能力,在提供服务时降低成本。
  BigTable是建立在GFS和MapReduce之上的结构化分布式存储系统,可以帮助Google最大限度利用已有的数据存储能力和计算能力,在提供服务时降低运行成本。
  BigTable提供的API可以让开发者对Table中的数据进行CRUD操作,并且API提供了按行、按列等多种BigTable的数据遍历方式。
  除Google之外,目前已有越来越多的提供商正在为我们提供面向各种需求的云计算应用平台。随着云计算涉及领域的不断拓展,这个以互联网为中心的应用模式,必将会远远超出计算、存储服务等现有的应用领域,向更新颖的业务领域延伸。互联网的精神实质是自由、平等和分享。作为一种最能体现互联网精神的计算模型,云计算必将在不远的将来展示出强大的生命力,并将从多个方面改变我们的工作和生活。
  参考文献:
  [1]袁国骏.浅谈云计算及其发展应用.实验室科学,2009-04-28.
  [2]饶少阳.“云计算”运营的战略问答.信息网络,2009-11-15.
  [3]张建.云计算概念和影响力解析.电信网技术,2009-01-15.
  [4]欧阳钟辉.云计算与信息集成.泉州师范学院学报,2009-03-15.


转载注明来源:https://www.xzbu.com/9/view-1003405.htm