元数据及其在数字图书馆中的应用
来源:用户上传
作者: 孟庆兰
[摘要]分析了元数据的产生背景,介绍了其概念、特征、类型、格式、作用与结构及在数字图书馆中的应用。
[美键词]元数据 数字图书馆
1元数据产生的背景
随着计算机网络技术的飞速发展,电子出版物不断增多,正在以呈几何级数不断膨胀;图书馆的馆藏结构发生重大变化,电子资源和网络资源将成为图书馆馆藏的主体。因此对海量信息资源进行有效的组织和管理因而日显重要要,元数据的出现有其必要性。
2 元数据的概念、特征、类型、格式、作用与结构
2.1概念与特征
元数据的英文名称为Metadata。迄今为止对于元数据人们并没有完全统一的定义,最常规的定义为:元数据就是关于数据的数据(data about data)。在哈佛大学数字图书馆项目里,其定义为:元数据是帮助查找、存取、使用和管理信息资源的信息。在这个定义里,元数据既适合于电子资源,又适合于非电子资源;不仅包括编目信息,也包括其他管理和存取资源的信息。国际图联IFLA的定义为:“元数据就是关于数据的数据,即指任何用于帮助网络电子资源的识别、描述和定位的数据。”
元数据具有三个特征:(1)元数据是一种编码体系,它能根据某种标准来对文献中的词及其他元素进行编码,从而揭示、描述文献的这些基本元素。(2)元数据不仅可以描述数字化信息的内容特征,而且可以描述数字化信息的基本属性,使得数字化信息得以被有效传播、交流和利用。(3)元数据为数字化信息资源建立了一种机器可理解的框架。
2.2类型与格式
在数字图书馆系统中,常用的元数据有五种类型:①管理型元数据是用来管理与支配信息资源的元数据,如信息收集、版权与翻版跟踪、排架信息、等;②描述型元数据是用来描述与识别信息资源的元数据,如记录编目、寻找帮助、专题等;③保存型元数据是与信息资源保存管理有关的元数据,如资源的物质条件、数字资源的保存行为);④技术型元数据是与系统怎样运行有关的元数据,如硬件与软件,数字化信息的格式等;⑤使用型元数据是与信息资源用户层次和类型有关的元数据,如用户记录、用户使用跟踪等。
网上数字资源比较常用的元数据格式有:①艺术作品描述类目。主要应用于艺术作品、珍善本和其它三维作品。②建筑文献基础/建筑图样咨询组格式。作为描述建筑图样类目的指南,能为描述与访问建筑文献信息提供指标。③美国视觉资料协会核心类目。主要用来描述网络环境下的艺术、建筑、手工艺等艺术类视觉资料。④艺术与文化遗产数据输出格式。用于文化艺术类作品及珍善本等的著录。⑤美国机读目录格式USMARC格式是目前适用于书目记录数据系统最完善、类目最复杂、标准最严密的元数据格式。⑥都柏林核心数据(Dublin Core)。都柏林核心数据类目是为改善万维网资源的索引与检索而提供的基本信息或者说元数据类目
2.3作用
元数据是数字信息资源组织的重要工具。它在数字信息资源组织方面的作用主要体现在以下几个方面:(1)描述作用(Descrip-fion)。它最基本的功能就在于对信息对象和位置进行描述,从而为信息对象的存取与利用奠定必要的基础。(2)描述作用(Loca.tion)。元数据包含有关网络信息资源位置方面的信息,由此便可确定资源的位置之所在,促进了网络环境中信息对象的发展和检索。(3)发现作用(Discovery)。在著录的过程中,将信息对象中的重要信息抽出并加以组织,赋予语意,并建立关系,使检索结果更加准确,从而有利于用户识别资源的价值,发现其真正需要的资源。(4)评估作用(Evaluation)。元数据提供有关信息对象的名称、内容、年代、等基本属性,使用户在无需浏览信息对象本身的情况下,就能够基本了解和认识信息对象,参照有关标准即可对其价值进行必要的评估,作为存取与利用的参考。(5)选择作用(se.1ection)。根据元数据所提供的描述信息,参照相应的评估标准,结合使用环境,用户便能够作出对信息对象取舍的决定,选择适合用户使用的资源。
2.4结构
对于一个元数据格式来说,它由多层次的结构组成,具体如下:(1)内容结构(Content Structure),对该元数据的构成元素及其定义标准进行描述。(2)句法结构(Syntax Structure),定义Metada-ta结构以及如何描述这种结构。(3)语义结构(Semantic Struc―ture),定义Metadata元素的具体描述方法。
3元数据在数字图书馆中的应用
元数据在数字图书馆中的应用主要表现在以下几个方面:(1)对信息资源进行组织与检索。要有效利用数字图书馆的数字收藏,必须对其进行著录与标引,得到提示其内外部特征的元数据,科学地将其组织起来,以便用户快速、准确地找到所需信息。(2)作为设计与维护数据库的工具。在进行数字图书馆的数据库设计时,设计人员须查看每个可能成为数据来源的系统的物理结构、逻辑模型和业务规则等,这个进程就是元数据的搜集进程。(3)作为用户使用数字图书馆的向导。通过公布描述数据库的元数据,可使用户无需浏览信息对象本身,就能对信息对象有基本了解和认识,从而作为取舍的标准。
参考文献:
[1]王云娣.数字信息资源的开发与利用研究[M].武汉大学
出版社,2005,49~50
转载注明来源:https://www.xzbu.com/2/view-1539458.htm