国内外数字图书馆研究与发展现状
来源:用户上传
作者:
[摘要]对国内外数字图书馆的发展现状进行总结,认为国外的数字图书馆研究更注重人的因素,用户研究和数字图书馆员教育成为重要研究课题,由数字化环境带来的新问题――开放存取、机构知识库和长期保存也成为研究的重点;国内的数字图书馆研究则侧重于个性化和互操作研究。另外,作为数字图书馆系统结构的重要组成部分,NKOS的研究在建设、标准化和互操作方面发展较快。
[关键词]数字图书馆 用户 开放存取 机构知识库 个性化 互操作 NKOS
[分类号]G250.76
1 国外数字图书馆研究与发展现状
1.1 与数字图书馆的使用和用户相关的研究
1.1.1 数字图书馆的使用 为教学服务是国外数字图书馆使用方面的突出特点。美国犹他州立大学和美国国家科学数字图书馆(NSDL)合作进行了一项为期5年的研究项目,以增强教师利用数字图书馆资源设计学生活动的能力,并专门为此开发了一项名为InstructionalArchitect的简单数字图书馆服务。该项目不仅有助于为学生设计更有意义的活动,进而增加现有资源对于教师的价值,而且能够促进本地教师的合作。共享和共创教学活动也能使传统单独的备课行为变得更加具有合作性和更有效。其他以教学为中心的项目包括spo-ken Word、DialogPlus、DIDET和DART等项目。
1.1.2 数字图书馆的用户研究Lack指出,随着信息资源数量的增长,数字图书馆和档案馆应创建能满足用户需求的、可用的服务,在开发的所有阶段寻求用户的输入有益于实现上述目标。
亚历山大数字地球原型项目致力于推动亚历山大数字图书馆所拥有的地理空间信息资源在本科教学中的应用。该项目围绕亚历山大数字图书馆(ADL),为教师、助教和学生提供了一系列的服务。Borgman等就本科地理课教师的信息检索和使用行为开展了访谈,结果表明个人数字图书馆是为教学服务的地理数字图书馆的关键,每位教师都有着其独有的选择、收集和组织教学资料的方法。此外,为教学和科研服务的数字图书馆也应该能够从常用的办公软件中导人内容,并将其内容存为可导入其他应用程序的标准格式。
Vakkari和Talja以网络问卷的方式对芬兰国家电子图书馆的最终用户进行了研究,结果表明:在期刊和参考数据库中进行关键词检索在所有学科领域中都是最重要的资源获取方法。在数据库中进行关键词检索在自然科学、工程和医学领域更为普及,而浏览、追踪和以同事为获取来源则在人文学科中更为普及。
1.1.3 以用户为中心的元数据研究 美国印第安纳大学的IN Harmony项目采用以用户为中心的方式开发了描述乐谱馆藏的、可互操作的元数据模型,综合使用检索日志分析、卡片排序和任务分析方法发现乐谱的需求,并将用户研究方法和元数据设计合二为一。Ferran等对350名学生在一个学期中使用虚拟课堂学习对象的日志进行了分析,以改善元数据质量及促进个性化服务。
1.1.4 以用户为中心的数字图书馆评估 近年来国外数字图书馆评估研究也表现出向以用户为中心转向的趋势。Blandford等从数字图书馆适合用户的各类工作活动的角度出发,提出了以用户为中心的数字图书馆评估框架PRET A Rapporter,并介绍了在其基础上进行的3个个案研究。
Ismond和Shift从用户的角度比较和评估了加拿大、美国和英国的6个免费医学数字图书馆,指出为了最大限度地发挥潜力,在医学数字图书馆发展的过程中必须强调馆藏的质量和更新,与用户使用的技术保持一致,提供促进复杂的学术信息的存取和理解的服务,同时确保在线用户知道这些数字图书馆的存在。
Norberg等则以记录美国南部数字图书馆为例,介绍了通过可用性测试和迭代设计过程生成一个以用户为中心、可持续发展的数字图书馆的过程。他们进行的一系列可用性测试和专题小组研究表明,用户和数字图书馆的交互面向任务并基于背景;为多个用户群服务是一个交互的过程,需要持续与用户对话。
1.2 开放存取和机构知识库
开放存取运动号召通过公共因特网提供免费的文献资源。自存档和开放存取期刊是开放存取运动的两大主要方式。这一运动正在逐步改变传统以出版商为中介的学术交流形式。
Rumsey通过介绍伦敦经济政治学院科研在线系统(LSE RO)的开发过程描述了机构知识库的价值,指出机构知识库不但可以收集和管理该学院的科研产出,而且可以保存他们的科研出版物并优化其使用。与此同时,她还指出机构知识库可以通过引文机制指向出版商所出版的版本。
美国密歇根大学信息学院MIRACLE项目组2006年对美国机构知识库的调查表明,已有48所美国院校实现了学院知识库,另有162所院校在计划开发学院知识库。该项目组目前正以实地研究的方法调查机构知识库成功的案例及其原因。英国诺丁汉大学和瑞典隆德大学合作进行的开放存取知识库指南则分类列出了世界各国开发的1 222个开放存取知识库,并对其进行了统计和分析。
Bergman回顾了给学术交流系统带来压力的主要原因并总结了开放存取运动的最新发展,认为开放存取运动已经取得了一定的成功,商业性期刊、开放存取期刊和数字知识库在可以预见的将来会作为学术群体使用的信息资源继续并存。Henneken等调查了美国康奈尔大学推出arXiv电子出版物知识库后天文学和物理领域中引用行为的变化,证明一开始即以电子出版物的形式出现在arXiv中的论文被引用的次数多于其他论文。此外对于一些天文学和物理领域中的主要期刊,最重要的论文均首先被提交到arXiv中。
2007年10月,联合国教科文组织和美国国会图书馆在法国巴黎签署了建立世界数字图书馆的协议。世界数字图书馆将数字化世界各国图书馆和其他文化机构所拥有的珍稀罕见的资料,并使其可以通过因特网免费访问。这些资料将包括手稿、地图、书本、乐谱、录音资料、胶卷、印刷品和相片等。其他开放存取的例子包括国际敦煌项目⑤等。作为开放存取运动的一支,开源软件通常有其专门的使用许可,在数字图书馆领域广为使用的开源软件包括DSpace,E-Print和Greenstone等。
开放存取和机构知识库可能面对的挑战包括版权和版本控制等。随着越来越多的大学和学术机构开始强制要求教师及研究人员将其科研成果存入学院知识库中,来自出版商的阻力亦不可低估。
1.3 数字资源的长期保存
2003年公布的美国国家医学图书馆文献类型定义的目标是为确保电子内容的长期存取提供基础。美国国会图书馆和大英图书馆均支持这一定义。斯坦福大学开发的LOCKSS系统的目标是通过低价PC电脑和开源软件为已出版的内容生成网络缓存以实现电子出版物的长期保存和存取。受控LOCKSS则采
用LOCKSS技术来确保知识库中的学术出版内容在灾难中的安全,并以此来实现数字形式的学术出版内容的长期存取。Cantara的研究表明辅助自动和半自动获取、收集和生成数字保存元数据的工具是确保长期保存的关键。
1.4 数字图书馆员的教育
Choi和Rasmussen调查了在美国高校图书馆工作的数字图书馆专业人员的日常活动和所需技术及培训中可能存在的缺口。他们分析了数字图书馆工作实践的性质,并确认了数字图书馆员常见和必须的知识与技术。
Bawden等比较了斯洛文尼亚和英国教育数字图书馆员的教育方式,发现正式教育和继续培训在上述两国均有使用,并涉及数字图书馆的各个方面。
2 国内数字图书馆研究与发展现状
2.1 我国数字图书馆建设成就
数字图书馆在国内的研究亦如火如荼。程鹏从理论、信息服务、信息技术应用、元数据和数字图书馆的版权问题5个方面综述了2005―2006年间我国数字图书馆研究的发展状况,认为我国数字图书馆的研究范围广,基本覆盖了数字图书馆研究的各个方面。
经过十余年的发展,我国的数字图书馆建设取得了一系列成果,分别建立了(或正在建立)国家数字图书馆、国家科技图书文献中心、国家科学数字图书馆、中国高等教育数字图书馆、中共中央党校数字图书馆、全军院校数字图书馆和中国社会科学院系统数字图书馆7个国家级数字图书馆(系统)。孙承鉴等在回顾我国数字图书馆10年发展历程时,列出了重大事件年表,从中可了解我国数字图书馆发展脉络。
国家数字图书馆于2008年9月9日正式竣工试运行,成为我国数字图书馆发展的标志性事件。《数字图书馆论坛》为此配发专刊,对国家数字图书馆建设中的体系结构、资源建设、标准建设、版权管理、信息处理和长期保存等内容做了全方位的探讨。
图书馆学、情报学和计算机科学对这一领域有着自己特有的贡献。单纯地割裂图书馆学、情报学或计算机科学对我国数字图书馆研究和发展的贡献是片面的;但是情报学在其中也确实有着自己较为独特的贡献,这其中以个性化与推荐研究和互操作问题为代表。
2.2 数字图书馆的个性化与推荐研究
数字图书馆的个性化研究一直是国内数字图书馆研究的热点之一。笔者在中国知网以篇名中同时出现“数字图书馆”和“个性化”两个关键词的检索方式,查得65篇文献,其作者以情报学和计算机科学领域的学者居多。陈江萍对国外29个数字图书馆进行了统计分析,认为一些数字图书馆已经开始采用个性化服务和社会计算工具,其中有的数字图书馆(如ACM Digit―al Library)已经走得很远。随着馆藏资源的增加和信息洪流对用户影响的加剧,数字图书馆应提供更多的个性化信息服务。
那么,什么是个性化信息服务?它有哪几种具体的实现方式?聂鑫对这一问题给出了一个参考答案。他转引van Dyke对个性化信息服务的定义,认为“个性化信息服务是基于信息用户的信息使用行为、习惯、偏好和特点,向用户提供满足其各种个性化需求的一种服务,它针对每一个用户的独特信息需求进行有针对性的服务”。同时,他将个性化信息服务分为通过显式反馈方式和隐式反馈方式实现两大类。隐式的数字图书馆个性化服务是研究的难点和热点。随着研究的深入,会有更多的信息技术应用于个性化信息服务之中。就这一问题,张玲等人按照发展顺序,从MyLibrary、超越MyLibrary到MyGrid对数字图书馆的个性化服务进行概述,并认为“用户逐渐真正成为主导要素,推动数字图书馆确立以用户为中心的设计原则”是数字图书馆的发展趋势之一。
个性化的数字图书馆与推荐服务密不可分,研究人员在尝试提供高质量的“拉”服务的同时,对“推”服务的研究也不遗余力,并使推荐技术成为数字图书馆个性化信息服务的主要支撑技术。刘燕权讨论了将推荐系统应用于数字图书馆所遇到的问题,包括数据规模、预算约束和隐私问题,他认为弄清用户对推荐系统的看法和其中的社会因素是现有研究中共有的要素。黄晓斌分析了基于协同过滤的数字图书馆的推荐系统,介绍了基于用户、模型、项目、项目评分预测、项目聚类和实践社区建模的协同过滤推荐方法。
但是,数字图书馆可用性研究在国内开展得并不十分充分。对此,马翠嫦从理沦研究、评估报告、专题研究和评价方法4个方面,对国外的可用性研究做了扼要的综述。
2.3 数字图书馆互操作研究
我国数字图书馆在系统实现方面研究的另一重要领域是互操作,它同时也是数字图书馆系统建设和体系结构搭建过程中不可避免的问题。互操作问题影响到数字图书馆的两个层面:一是数字图书馆的系统结构;二是数字图书馆知识组织系统的互操作。
在数字图书馆的互操作研究中,OAI扮演了重要的角色。OAI的目的是促进信息的交换和共享,包括OAI数据提供者和OAI服务提供者两部分。齐华伟和王军对应用OAI搭建数字图书馆的项目进行了扼要的总结,并基于OAI搭建了一个个人数字图书馆。夏立新等人综合使用OAI和主题图搭建了一个分布式的数字图书馆体系结构。在这个框架内,P2P、OAI和主题图是该数字图书馆的支撑技术,并且其三层的体系结构自底向上分别基于P2P、OAI和主题图这三种技术。实现体系结构方面从硬到软的逐层过渡。郑志蕴等则综合使用网格技术和OAI来完成数字图书馆体系结构的搭建。此前,他们对其中的元数据互操作问题进行了详尽的讨论。
3 数字图书馆的知识组织系统
3.1 网络知识组织系统(NKOS)及其分类
知识组织系统(KOS)指对知识结构进行系统化描述、解释和说明的工具,意在涵盖所有的用于组织信息以实现知识管理的概念结构,主要用于对信息资源进行组织,并支持对相关内容的检索。NKOS既包括传统KOS在网络环境下的应用,也包括在网络环境中发生和发展的新的KOS。前者以CyberStacks和IN,FOMIN为代表;后者以Yahoo!网络分类指南、搜狐分类目录和WordNet词汇参考系统等为代表。
根据知识组织系统的结构、复杂性和元素间关系以及语言的受控程度和结构化程度,曾蕾和Salaba提出将NKOS分为术语表、分类法和词汇关系表三类。其中,术语表用于对实体进行定义和解释,分类法注重主题集的形成,对实体之间关系的揭示重点在于属一分关系,词汇关系表对实体之间关系的揭示不仅仅局限于用、代、属、分、参的关系上,还强调概念与概念之间的相互关系,例如整体一部分关系、蕴含关系等多种复杂关系。
3.2 NKOS的应用与建设
NKOS要在网络中发挥作用首先应当具有如下特征:①以一个特定的视角来看待网络资源及其中的内容;②相同的实体在不同的NKOS中以不同的方式进
行特征化;③NKOS中的概念及其所指向的现实世界的对象必须存在一定的共性,以保证具有相关知识基础的用户能将该NKOS对应于一定的现实世界。
目前NKOS的应用主要是支持网络环境下的知识组织和信息检索两个方面。NKOS的基本功能是组织网络信息资源,包括直接将NKOS用于资源组织以及通过NKOS组织、并以可视化的形式显示信息,提供一个虚拟的学习环境的应用。而NKOS对信息检索的支持主要体现在检索式构造和检索结果显示等方面。
NKOS的建设目前主要有改造传统KOS、创建NKOS及NKOS维护三种手段。传统KOS的改造是指对那些长期应用于图书馆的分类法、主题词表等进行调整和重构,使之适用于网络环境下的新应用,其主要代表是CyberStacks和Scout Report Archives。NKOS的创建则是指建立新的适用于网络环境的NKOS,一般具有较强的针对性,以Yahoo!和Amazon产品目录为代表。根据信息资源的发展和用户需求的变化对现有NKOS进行调整、更新和维护,称为NKOS的维护。KIM系统通过在用户使用系统过程中与用户交互的方式实现了命名实体的更新,DL-KOS则通过从元数据中抽取词语并将其补充到现有NKOS中的方法提供了NKOS更新的另一条思路。
3.3 NKOS的标准化与互操作
NKOS的异构性使标准化和互操作成为目前NKOS的研究热点。标准化着眼于NKOS结构的统一;互操作着眼于在不同的NKOS之间建立连接或映射。
NKOS的标准化主要是知识结构表示与描述的标准化、互操作的标准化和NKOS检索和浏览的标准化。知识结构表示与描述的标准化使得不同的机构对NKOS本身的描述遵从统一的标准,从而实现NKOS的互操作。W3C推出了OWL和SKOS标准,是知识结构描述标准化的典型规范。NKOS互操作标准化的代表是W3C提出的SKOS Mapping Vocabulary Specifi-cation草案,解决NKOS之间映射的描述与表示问题。ANSI/N/SO Z39.19标准就是创建和管理主题词表的标准,属于NKOS检索和浏览的标准化。
对NKOS互操作的研究主要集中于欧洲,国内仅有少数关于中、英文分类法或主题词表的对比研究。NKOS互操作的各种实现方式还处于探索阶段,曾蕾和Lois Mai Chan总结了NKOS互操作的8种实现方式,分为NKOS的演化、临时联合列表方式、NKOS映射和服务协议方式4类。NKOS的演化并不以互操作为目的,而是为满足特定需求对原有NKOS进行改造;但新建的NKOS与原有NKOS间形成了对应关系,于是在客观上支持了互操作。临时联合列表基于对查询提问的字面匹配,但是没有保存索引或映射供后续使用,因此互操作的效率和准确性不是很高。独立形成的NKOS之间的映射和服务协议方式是实现NKOS互操作的主要方式。在参与互操作的NKOS比较明确时,映射方式比较适用;而在参与互操作的NKOS并不明确时,则应选择服务协议方式。
目前实现的各种NKOS间映射大多是以人工的方式,通过对NKOS自身结构的理解和词语、概念含义的判断建立的,其他方法仍在探索中。基于统计的方法是实现NKOS层上的直接映射的一种方法。斯坦福大学医学信息组开发的本体合并工具Anchor-PROMPT基于统计方法实现不同本体之间的映射。而基于元数据中共现关系的映射研究大多处在对不同NKOS词语、类目的分布情况的统计,或部分词语、类目间的映射,这主要是受到了元数据规模和分布的限制。这些研究为进一步实现基于元数据中共现关系的NKOS互操作提供了理论和实践基础。此外,UCSB的ACL项目是通过服务协议提供知识组织服务,从而实现NKOS的互操作的探索。
4 结语与展望
国外数字图书馆领域的研究开始从以系统和项目为中心向以用户和服务为中心转移。与数字图书馆的使用和用户相关的研究几乎体现在数字图书馆发展的各个环节。开放存取和机构知识库进一步得到了认可和大规模的发展,一些大学和学术机构开始强制要求教师及研究人员将其科研成果存入学院知识库中。针对数字资源的长期保存的标准和技术亦开始得到发展。数字图书馆相关技术的发展在互操作、质量控制和信息可视化等方面得到了体现。与此同时,数字图书馆员的教育也日益为相关的教育工作者们所重视。
十余年来,国内数字图书馆的研究和建设如火如荼,并得到了国家的大力支持。国家数字图书馆竣工成为标志性的事件之一。在我国数字图书馆的研究中,个性化和互操作是重点研究对象,但是,这样的研究更侧重于系统实现,与国外相比,对用户的深入研究并不十分充足。这是我国数字图书馆建设和研究在未来应予以加强的层面。
作为数字图书馆的知识组织和管理系统,NKOS起到了重要的作用,尤其在NKOS在传统知识组织系统的改造和知识组织理论和方法的发展中。在NKOS的研究中,标准化与互操作紧密联系,为降低信息资源的异质性和促进信息交流做出了贡献。
目前,数字图书馆的研究和建设处于一个相对的平静期。数字图书馆十余年的发展需要我们总结经验并回顾反思。在积累了大量的理论和实践经验的同时,如何改善数字图书馆员的业务素质,如何促进全民的信息素养,这些都是在数字图书馆这一平台上所需要着重研究的事情。数字图书馆的研究和建设,不仅要有数字图书馆系统,更要培养高素养的信息公民。
转载注明来源:https://www.xzbu.com/1/view-153863.htm