政务数据中心的设计与实现
来源:用户上传
作者:
摘要:探索了电子政务综合政务数据中心的设计及其技术实现的思路。
关键词:电子政务 政务数据中心
一、概述
政务数据中心集数据的运算、交换、存储及信息安全为一体,为电子政务应用提供服务。数据中心采用服务、应用、存储相分离的架构,以降低管理维护的成本,满足日益增长的业务数据对系统扩容的需求。一个完整的数据中心由网络系统、应用服务系统、存储系统、远程容灾系统、网络管理系统等部分组成。
电子政务综合政务数据中心在建设时要达到的主要目标为:利用应用支撑平台“集中部署、分布应用”的优势,实现业务信息在应用过程中的集中存储和管理,为信息资源共享创造条件。
举例来说,青岛市政务数据中心要对现有的架构进行补充完善,使其集环境支持、高可靠网络、高可用服务、数据存储、负载均衡、系统容错容灾、网络管理及应用服务状态监控、信息安全等多种集成技术于一体,最终实现以下目标:
――完善全市政务资源目录体系,形成覆盖全市各业务部门的全部政务信息资源目录,为资源的有效开发、利用提供参考依据和指导;制定数据共享、交换技术标准及管理规范,使各部门信息资源能够方便、快捷、安全地共享和交换;确保各部门应用系统的规范、协调、健康发展,以促进业务协同,避免重复投资。
――建立全市政务资源数据库,整合全市政务资源,对基础数据进行集中管理;建立科学的数据更新维护机制,确保基础数据的一致性、准确性和完整性;最终建成政务资源数据仓库,为领导决策、公众服务和各业务部门提供数据支持。
――建立全市统一的共享平台,实现全市各部、委、办、局的数据交换与共享,解决“信息孤岛”问题,并对业务部门的应用系统建设提供有效支持。
――在全市政务资源库的基础上,通过数据共享和交换平台,采用先进的数据仓库技术、数据挖掘和分析技术、数据展现技术等,为领导决策、公众服务等提供方便、直观和灵活的数据服务。
――实现与已建应用系统的无缝集成和融合,按照相关标准规范,确保系统的扩展性和各部门应用系统的整合。
二、政务数据中心的总体设计
按照数据类型,可将政务数据中心分为两类:结构化数据中心和非结构化文档管理中心。两类政务数据中心的建设采取的是不同的模式。
⒈结构化数据中心的功能设计
结构化数据中心的信息集中主要包括四个层面,即物理层、数据层、应用层和管理层。对于数据中心来讲,主要面对的是物理层与数据层的信息集中。在电子政务各种业务系统与管理信息系统中,各种系统的信息集中与共享,主要是如何直接从各应用系统中获取数据,汇集到中心数据库中,以反映整个信息化部门当前的业务状况,及时为各级人员提供信息,有效管理各个业务部门和各个层次的业务状况。
结构化政务数据中心设计目标如下:
⑴可用性
设计系统通过提供一个强大的、经全面验证的体系结构,以消除所有单点故障,满足可用性要求。该体系结构提供存储及系统冗余以实现容错。为了在服务器发生故障时解决可用性问题,该系统采用服务器故障转移集群。
⑵可伸缩性
为满足数据中心的用户需求和业务要求,确认组织中当前的数据增长和关联的数据服务,该数据中心根据应用程序的不同要求,采用向上扩展和向外扩展的方法;同时,通过采用可根据需要无缝扩展的SAN和I/O技术,存储可伸缩性可以得到提升。
⑶安全性
该系统通过将数据从处理资源中分离出去,增加额外的数据安全性等级等方式实现多种层次的安全性;另外,还利用SAN所提供的高级安全特性。
⑷可管理性
该系统构建的可管理性非常重要。在数据中心的相关文档中会提供有关安装、配置、预备、当前健康状况监控、故障检测和性能监控的指南。该体系结构包含持续监控和排除常见操作故障的功能。
⑸可恢复性
当系统发生故障时,该数据服务体系结构可以通过运用多余的计算资源以及数据和处理资源的分离,提供系统、数据和/或配置的最佳恢复模式,必须对数据中心提供一个全面的备份和恢复解决方案。
⒉非结构化文档管理中心的功能设计
⑴文档管理中心的体系结构
图1显示了文档管理中心的体系结构。
图1文档管理中心的体系结构
⑵文档管理中心系统的特性
文档管理中心系统的特性包括以下几个方面:
①文档属性。在文档内容之外,文档管理系统为文档定义一组属性(MetaData),属性和文件类型的区别在于:类型只是说明了这份文档是什么样的存储格式,如Word文件和Excel文件;而文档属性则定义了描述该文档的更多“元”信息,如作者、日期、标题、状态和主题等可以标注文档内容的一套说明。这些属性在文档发布的时候由作者提供,或在修改时由修改者提供。系统管理员可以强制这一标注过程的执行,只有提供了规定的标注后文档才能被发布。
②文档存储发布。文档的存储发布,除了一般意义上的集中存放外,还提供对文档历史版本的跟踪,用户可以保存同一份文档多至1000的个历史版本。
③文档的签入签出。文档的签入签出避免了多人同时修改一份文档而造成文档不一致的问题。
④文档的检索与订阅。文档的检索是任何一个文档管理系统所必须具备的功能:除了通常的全文检索以外,结合文档的属性定义特性,文档管理系统还可以针对文档的属性进行检索,这些检索可以作为订阅条件被存储,从而在有了新的满足检索条件的文档时,文档管理系统可以通过E-mail方式或者在个性化的信息门户上显示出来。
⑤文档协同工作。在一份文档需要多人协作的情况下,文档管理系统还提供了在线讨论的功能:多个人可以就同一份文档进行讨论,发表自己的意见,并最后由作者负责决定是否将这些意见纳入正式的文件中。
⑶文档管理中心的功能
鉴于文档管理中心系统的上述特性,该系统可实现以下两大功能:
①提供文档索引、检索、存取控制、版本控制、归档等功能
文档管理中心系统提供企业级的文档库,能够实现文档管理中的索引、检索、存取控制、版本控制和归档等文档库所要求的功能,并且还提供高效快速的搜索引擎,实现基于文档内容的全文检索能力。同时,针对来自不同内容源的文档和数据,该系统还可以使用协议处理程序和收集程序定时进行数据和信息的抓取,建立搜索索引,并提供针对其进行全文索引和检索的能力。
针对文档的索引,该系统目前支持市场上主要的文件类型,如Office文档、文本文档等等,同时还可以根据具体要求,利用软件开发包(SDK)所提供的编程接口,通过开发方式提供对更多文档类型的支持。
②提供应用开发接口
该系统提供多种应用开发接口方式,可以通过系统所提供应用开发接口(API)、Web Service,或通过微软公司的BizTalk Server 2004应用集成平台,与其他的应用系统实现数据和流程的接口。
三、政务数据中心的技术实现
⒈结构化数据中心的技术实现
为满足系统设计目标,结构化数据中心的数据库以微软公司的SQL Server 2005为例展开研究。SQL Server 2005将数据分割成分别托管于负载平衡集群和服务器集群的只读和读/写两个类别,为实现更佳的数据查询性能,数据存储采用SAN架构。运用多CPU计算机执行OLTP应用程序的处理工作,可以满足高性能、大数据量数据库的需求;同时利用SQL Server 2005提供的OLAP、Reporting Service,实现集中的数据分析、数据报表功能。
该数据中心采用这些技术,主要目的是为了提高可用性和可伸缩性。
⑴提高可用性
提供高度可用的数据服务是数据中心的最主要目标之一。数据中心将数据服务划分为多个层次,并解决每一层可能存在的故障。
在数据中心的设计中,通过采用下列方法解决可用性问题:
①硬件冗余
每个可行的硬件组件均拥有一个备份,以便在主组件发生故障时接管其功能。所有服务器都拥有组合网络接口卡,允许两个接口卡共享相同的IP地址。交换机等其它硬件组件也拥有冗余副本,从而使任意一点的硬件故障不会导致服务的中断。
②通过冗余路径消除单点故障
数据与服务器间的所有路径均为冗余路径,即便组件或路径出现故障时,该系统也可以执行连续性操作。路径管理软件的使用,可以在路径故障发生时,在冗余路径间选择路径,从而保证了操作的连续性。
③最佳的故障转移顺序和故障转移/故障返回计划
数据中心的数据服务采用操作系统所提供的服务器集群提供高可用性,以防止发生软硬件故障。当服务器出现故障时,备用系统将接管故障系统的功能。备用系统允许(根据服务器的容量和负载)建立首选故障转移路径,并在主资源重新联机后执行故障返回。
④运用只读负载平衡数据库集群
在网络负载平衡中,如果一台服务器遇到故障,相关请求将在剩余且仍处于联机状态的服务器间进行重新分布。该分布可为只读数据库负载提供更高的可用性。
⑤将日志发送用作可用性解决方案
当服务器集群运转时,共享磁盘的故障可能引发故障转移,从而对可用性造成负面影响。为此,要在这类情况中确保灾难恢复,有效执行从集群节点到远方的独立服务器或服务器集群节点(即热备用服务器)的日志传送。两个位置间应该拥有良好的网络连接性,这也是实现远程容灾的一种方式。
⑥通过服务器集群获得高可用性
在系统发生故障时,服务器集群可自动重启应用程序。服务器集群协助提高数据中心的数据服务的可用性。同时,应用程序必须具有集群戒备功能,如果因故障转移发生连接中断,应具备重新连接到数据库的预备措施。
⑵提高可伸缩性
数据中心应具备支持附加服务和附加用户的扩展能力。根据所需提供的服务数量和速度以及数据服务吞吐量,该系统可以提供以下两个扩展策略。
一是向上扩展:在同一台服务器上增加更多可扩展性能的硬件设备,如CPU、内存,不增加服务器的数量。通过上扩可增加数据库容量,数据中心可以向相同的SQL Server实例重复添加资源,以便从服务器获得所需的性能。
二是向外扩展:增加更多的服务器,并在其间分布处理负载,以提高性能。通过向外扩展还可增加只读数据库的容量,通过采用分布于多台服务器的联合数据库,允许不同的用户和服务集利用不同的服务器;针对不同服务器的读/写和只读数据库服务的分离和部署,允许负载平衡服务器集群提供最佳的只读服务,同时允许向集群添加新的服务器,并相对轻松地满足不断升级的要求。数据库的读/写部分可位于不同的服务器上,这些服务器组成一个服务器集群,以便确保事务和可修改数据的高可用性及附加的安全性。
⒉非结构化文档中心的技术实现
Microsoft SharePoint Portal Server 2003是一个智能、灵活的门户解决方案。它将企业业务流程中的人员、团队和知识连接在一起,将分散的信息统一起来,便于就文档、项目和其他工作进行协作,并根据用户的功能组和组织角色呈现特定应用程序和自定义内容。SharePoint Portal Server 可与Microsoft Content Management Server、Microsoft Windows资源管理器、Microsoft Office 应用程序和Web浏览器协同工作,帮助用户在整个组织范围内创建、管理和共享内容。
SharePoint Portal Server 赋予用户在其所在的公司、分部、部门的IT环境中查找、共享和发布信息的能力,这种能力甚至能扩展到Internet。使用预先打包的被称作Web Part的.NET组件可以让用户灵活地“拼装”不同功能的页面。同时,SPS允许用户使用他们最熟悉的客户端――web浏览器、Office或文件系统完成会议、文档等协作。SharePoint可以满足各种规模企业(从小部门到大型的分布式企业)的上述需求。
⑴Web Part
每一个信息模块被称为一个Web Part,Web Part之间可以是互相独立的,也可以是互相影响的;不同的Web Part组合成一个仪表板,仪表板组合成为一个层次化的门户站点。
⑵数字仪表板
数字仪表板是企业信息门户的基础技术,由多个称为Web Part的组件构成。Web Part是信息门户中一个单元,每一个Web Part负责包装一个信息源或者服务源,所有Web Part集中为数字仪表板。
按照其包装内容的不同,Web Part有不同的实现。对于现有企业信息网站和外部信息网站,Web Part包含指向这些信息源的地址。对于企业应用服务、文档管理系统,可以定制开发与这些系统接口的Web Part,这些Web Part负责和应用系统的交互。
⑶Web存储系统
Web存储系统(Web Storage System,WSS)是文档管理系统的存储机制。WSS是一种半结构化数据库,存储的内容不是可以用表和字段组织的数据,而是像Word和Excel文件等这类半结构化的数据。与关系型数据库相比,WSS可以存放任何类型的数据,如文件、多媒体信息和邮件等。
WSS可以对存储在其中的数据赋予丰富的属性信息,这些属性信息相当于关系型数据库的字段,但对数据属性的设置和扩充完全根据应用的需要进行。
WSS提供多种类型的操作方式,这使得基于WSS的系统在开发时有了广泛的选择。对WSS的操作十分灵活,可以通过HTTP WebDAV,OLEDB,乃至普通的文件访问方式进行。
(本文责编:孙晓霞)
转载注明来源:https://www.xzbu.com/1/view-258893.htm