基于XML的高校异构数据交换平台设计
作者 :  李秉键

  摘要:当前,大多数高校都建立了自己的信息化管理系统,这极大地改变了原有的信息管理模式。以基于XML的高校异构数据交换平台设计为着眼点,对能够普遍应用于各高校不同部门的异构数据源平台进行了分析,并根据适用、便利的原则对系统进行了多层面的对比,进一步明确了虚拟视图中的Mediator方式,也即将XML添加到数据源中,实现了XML与异构数据源的互相转换。
  关键词关键词:XML;高校异构;数据交换平台
  中图分类号:TP319
  文献标识码:A 文章编号:16727800(2014)002010002
  0引言
  在高校所涉及到的不同单位和部门中,基于功能和业务方面的不同分工状态,会按照自身的业务需求,构建独特的管理系统和信息服务,在管理系统与信息服务之间需要进行数据的隔离。在技术不断进步、时间不断推移的状态下,信息系统会拥有着专用客户端、操作方法以及相应的处理对象,在不同的细节过程中会产生部门协同以及数据交流等问题。其中的单位与部门都是数据源的个体,每一个体都会是异构的模式,因而组成了繁琐而庞大的异构数据库环境。将信息系统有效集成,并实现集成数据的共享,让全校师生都能够拥有相同的集成共享平台,对数字校园的创建而言,具有一定的现实意义。
  1XML技术分析
  XML主要由HTML、SGML组成,HTML、SGML是目前较为显著的标记性语言模式。然而,XML是元标记的语言类型,一方面囊括着SGML的扩展性能和巨大的功能,另一方面还囊括着HTML的简便特性。
  XML所具备的扩展性,使得相关用户能够根据要求建立新型标记,所建立的标记利用DTD进行规范性的定义,DTD会在一定程度上对XML文档中的要素进行系统的规定,文档中所包含的要素分别为标记、属性、元素清单以及相互关系和文档实体。DTD能够用文档的状态将标记的标准正确阐述,同时要求用户对其标准硬性遵守[1]。XML具有如下优势:
  (1)保值性。XML的保值性主要由SGML引出,引出XML的保值性可以成为长久式的标准模式。
  (2)扩展性。XML会满足各个行业按照自身需求拟定属于自身的标记语言模式。
  (3)可读性。用户完全能够使用与定义拥有一定意义的标记,所产生的编码容易阅读和理解。
  (4)结构性。存储数据的相应格式上,不会和所显示的格式发生冲突。XML通过DTD规定出与标记符号相关的语义和语法规则,能明确地描述文本内容,并且能够细致描述文本中的结构关系等信息。在一定程度上提升XML资料的重用性、交换性以及理解性[2]。
  (5)数据的独立性。独立性方面的优势和协议、语言以及平台没有任何关联。
  2XML系统设计
  高校拥有着较多的部门和丰富的资源,因此对平台的设计与开发有所不同,从而促使产生不同形式的异构数据源。按照相应的使用模式,具体包含3种,即关系型数据库、XML纯文本文档以及相关应用数据,其中的应用数据包含报告、目录清单、邮件等。想要有效实现异构数据源集成,有两种不同的方式,分别为虚拟视图法和数据仓库法[3]。
  虚拟视图法所具备的独特优势是,将中间模式增加在数据源中,此中间模式利用制定好的数据模型开展详细的数据描述,以此将不同事物的约束、联系、属性、结构等反映出来。在查询过程中,系统能够通过有效分解用户的查询,来操作各个数据源,在结束查询的过程中,需要将每个数据源所展现出的结论进行细致封装,并提供给用户。对于虚拟视图法中的不同结构,在集成联邦数据库的过程中,有必要分别对访问的接口进行添加,实施起来不太便利。因此,对高校的需求和实际情况进行有效融合,通过Mediator/Wrapper系统方法,开展必要的设计开发,拥有着较为强大的适用特性[4]。
  据上述分析可知,不管对哪一类方式进行应用,异构数据源集成方面最为具体的任务是,要将集成系统作为基础,从而有效地设计公共模型,并对数据源中不同形式下的相应数据合理地转变成为通过集成系统能够充分解决的统一格式。此外,还需要对公共模型中基本形式的运算有所定义[5]。
  2.1集成框架
  按照虚拟视图法的具体需求,需要将系统几个层面体现出来,系统集成框架如图1所示。
  (1)信息源层。信息源层处在最低层,主要提供集成的全部数据,是作为提供者而存在的。例如文本数据、数据库等。
  (2) XML的中间件层。此XML中间件层能够将XML格式与数据进行相互转换,可以在XML的数据空间内对数据进行相应存储,并且能够确保各个异构数据源和XML数据空间相互的映射联系。
  (3) 应用层。所谓应用层也就是用户的界面层,相关的用户能够在此处开展系统的操作应用。例如数据挖掘或者数据查询等方面。
  (4) XML接口层。按照相应的转换协议内容,需要将操作的需求传送到XML的中间层里。运用这样的方式能够保持XML数据是相应统一的,并且要避免非法访问,接口处一定要实现对应的访问策略。
  2.2系统实现技术
  在图1所示的四层结构中,从信息源层和应用层的实现角度分析,是较为简单的结构,然而接口层主要按照详细使用需求,为实现用户数据访问而应用不同的手段。因此,对于XML中间件层的实现需要重点分析。XML中间件层处于应用层和信息源层中间的部分,此中间件技术能够将异构数据的集成合理实现[6]。
  各个异构数据源都会包含包装器和数据源,能够利用XML接口在服务器数据源不发生改变的基础上,通过XML的语言特征,为不同的服务器提供相同的包装。这种方式能够形成虚拟数据库的相应服务器,并在一定程度上让中间件虚拟地管理异构数据源,同时给予系统一定的虚拟数据库服务。数据源层/XML中间件层结构如图2所示。

文秘写作 期刊发表