基于Mashup技术的图书馆跨界合作服务研究
来源:用户上传
作者:
[摘要]对Mashup技术和图书馆跨界合作服务进行分析,论述Mashup在图书馆开展跨界合作服务中的应用现状以及存在的问题,在此基础上,探讨Mashup用于图书馆跨界合作服务时应该采取的策略。
[关键词]Mashup 图书馆 跨界合作 信息服务
[分类号]G250
在互联网信息爆炸式增长以及信息检索技术不断成熟的今天,图书馆与其在一个封闭的环境中自食其力,不如与外界合作,使其处于一个开放的环境中不断提高与发展。Mashup技术的出现为图书馆整合自身购买的信息资源、融合网络信息资源、开展跨界合作提供了便利。
1 Mashup与图书馆跨界合作服务
1.1 图书馆跨界合作
随着图书馆信息服务理念和技术的不断更新,越来越多的图书馆注重和外界信息服务机构的合作,例如,利用Mashup插件使馆内的书目信息与网上书店书目信息关联;让一定IP范围内的读者通过互联网搜索引擎直接检索使用图书馆的数字资源等。图书馆通过与其他领域的合作,使自己的资源利用率得到提升,同时也使相关合作机构能通过与图书馆信息资源之间建立关联而获得更多忠实用户。
跨界合作,英文为Crossover,是指跨越不同领域事物的合作与交融。究其本质,跨界合作是事物本身为了适应社会的发展,而采取的一种阶段性的改革与创新。在商业领域,跨界合作是把原本的竞争对手转化为合作伙伴,用最简单同时几乎是零成本享受竞争对手或者其他品牌的知名度和市场。跨界合作通过共享一部分并非专利的内容或者信息,共享一部分品牌特点,共享一部分忠实用户群,但是换取的是更大的利益,更多的用户,更广的市场,还有可能就此发现新的契机。在图书馆工作中,图书馆开展跨界合作服务是图书馆适应新的环境,谋求自身信息服务形式、内容不断完善和发展的一种合作行为。在OCLC与各检索引擎大公司的跨界合作中,搜索引擎公司为自己的用户提供了更丰富的信息内容,OCLC则通过搜索引擎提高了自身的资源利用率,是一种双赢的行为。
目前,开展跨界合作一直是我国图书馆界关注的焦点。2008年在我国图书馆联合编目中心年会上,如何面对“跨界合作”是当时研讨的焦点问题之一。研究图书馆跨界合作对图书馆借助其他机构的优势完善自身信息服务水平和保障能力,实现服务增值具有积极意义。
1.2 基于Mashup的图书馆跨界合作服务
Mashup源于流行音乐,是指从两首不同的歌曲(通常属于不同的流派)中混合演唱和乐器的音轨而构成的一首新歌。扩展到互联网,Mashup又称混搭,它作为Web2.0技术的一种,是从多个分散的站点获取信息源,组合成新网络应用的一种应用模式。它利用了从外部数据源检索到的内容来创建全新的创新服务,将来自不止1个数据源的内容进行组合,创造出更加增值的服务。混搭技术属于跨机构信息系统集成,即一个机构的信息系统实时调用外部信息系统提供的数据或者应用程序。通常,一个Mashup应用程序由三个级别或层次构成,第一层为数据层,第二层应用层,最后一层用户层。目前,许多知名IT企业,如微软、谷歌、雅虎等都提供了API接口,个人和机构可以通过组合这些API获得Mashup应用。
基于Mashup的图书馆跨界合作与传统的跨界合作有着一定的不同,这种合作并不是一个机构与另一个机构直接形成合作协议而开展合作。它是图书馆在网络环境下,利用信息服务机构免费提供的开放性信息资源访问接口而开展的合作。提供信息资源的机构事先并不知道谁会使用自己的资源,但是使用者需要遵守资源提供方的使用条款等规定(如豆瓣网的API使用条款等)。通过合作,提供资源的机构宣传了自己,获得了更多的用户和利益,而使用方则为自己的用户提供了更加丰富的信息服务内容。图书馆利用Mashup融合其他机构的信息资源和优势,是一种资源共享的跨界合作行为。换句话说,Mashup可以使一个机构融合任意其他有提供资源共享意愿的机构的资源,从而开展跨领域的合作。
目前,Mashup技术在图书馆信息服务中常见的应用形式为地图服务、图像或视频服务、书目信息服务等。图书馆利用Mashup开展跨界合作服务按合作的主体大致分为两类:一类是图书馆利用Mashup集成不同数据库系统的跨界合作行为。一些图书馆利用Mashup技术,将书目系统和超星电子图书、读秀学术搜索等关联起来,使读者在获取书目信息的同时获取图书的电子文本链接等。另外一类是图书馆利用Mashup技术集成网络信息的合作。一些图书馆利用Mashup技术调用豆瓣网的免费API接口,将豆瓣网汇集的许多读者对某一图书的评价等信息与图书馆网站的书目信息结合,丰富图书馆自身OPAC内容(内容简介、书封图片、书评信息)。
2 Mashup在图书馆跨界合作服务中的应用及问题分析
2.1 Mashup在图书馆跨界合作服务中的应用现状
在国外,美国弗吉尼亚州工程大学图书馆的LibX插件通过与一些购书网站中的信息相关联,使读者可以在浏览网页时点击图标就能访问图书馆书目系统,目前有810个大学及公共图书馆提供此功能。美国北卡罗莱纳州立大学图书馆、美国明尼苏达州立大学图书馆、加拿大麦克马斯特大学图书馆、新西兰奥克兰大学图书馆等基于谷歌地图API创建了自己的图书馆地图Mashup应用。美国丹伯里公共图书馆、美国印第安纳州立大学Variations/FRBR项目、加拿大安大略剑桥公共图书馆等利用Mashup集成第三方信息资源,提升书目信息的揭示深度等。在国内,国家科学图=}}馆(简称“国科图”)在SRU开放接口之上,基于Mashup组件技术构建Widget融汇仓储系统,封装、登记、保存图书馆基本服务组件群、专题服务组件群以及数字图书馆相关领域服务组件群,从而支持开放调用、动态组合、用户环境嵌入等多种应用。厦门大学图书馆将图书馆的OPAC系统通过Mashup技术和谷歌图书搜索API、豆瓣网API进行混搭,丰富OPAC页面内容,弥补了原有系统中的不足。在其他相关领域,OCLC将世界联合目录数据库直接开放提供给搜索引擎使用。重庆维普向谷歌学术搜索项目组提供《中文科技期刊数据库》收录期刊表,面向全球的学者提供学术搜索服务。在谷歌学术搜索的“图书馆链接”计划中,通过与图书馆合作,当确定使用者是某图书馆的会员时,谷歌在使用者的搜索结果中提供某图书馆拥有的资源的特殊链接。
2.2 Mashup应用在图书馆跨界合作服务时存在的问题分析
图书馆开展跨界合作服务是涉及不同的信息机构之间的合作,往往会因为机构性质、文化氛围等的不同而在合作中出现各种问题。
在图书馆利用Mashup技术开展合作的过程中,首先是技术方面的问题。Mashup是一种新兴的应用,处
于不断成熟的过程。在图书馆利用Mashup的过程中获取数据的协议和格式等没有统一的标准,数据和语义的质量等问题都是需要关注的;其次是知识产权问题。Mashup技术可以通过屏幕抓取等技术融合各种信息机构的信息,在这一过程中如果没有通过资源提供方的许可就去融合对方的信息,不仅有可能因为自己频繁访问对方服务器而对对方造成负担,甚至还会引起知识产权和法律权益纠纷;最后在服务过程中,由于读者对新的服务形式并不熟悉,也会造成Mashup应用于图书馆的跨界合作失败,流于形式。
3 图书馆利用Mashup开展跨界合作服务的策略
图书馆开展跨界合作服务是一种图书馆应对外界环境冲击的自身变革,是图情机构在以用户为中心、在用户个性化信息服务需求的作用下所采取的一种服务的改革,面对用Mashup开展跨界合作服务中的问题,图书馆应从以下几个方面应对:
3.1 使用公认的技术标准
将不同领域的信息资源进行整合,往往会因不同领域应用目的不同而导致不同领域的信息服务机构采用不同的标准和协议。Mashup作为一个新兴的领域,不同的信息服务机构所推出的编程模型和体系结构都有着很大的差异。缺乏统一的标准规范来规范获取数据时使用的协议以及格式,都会制约其进一步发展。另外,获取数据源的数据时使用什么样的协议以及文件格式、安全访问标准等都是图书馆利用Mashup进行跨界合作所要考虑的问题。
目前,在Mashup数据传输的协议中,最典型的有XMP-RPC、SOAP与REST,其中REST协议风格简洁,虽然不是网络标准,但得到了广泛的应用。在Mashup的数据存储格式中,RSS与TOM协议受到Web开发人员的喜爱。在安全标准方面,Mashup使用了大量的来自第三方的API,只要通过API认证,即可访问甚至修改源数据提供者的数据库。由于Mashup的开发还没有充分地考虑到安全性问题,这对源Web服务的数据安全以及用户的账户安全带来挑战。目前一些组织也致力于制定安全方面的相关标准,如:OAuth、Open ID等。虽然这些标准也得到了一些公司的支持,但并没有一个统一认可的标准,有待于进一步统一和完善。
出于易用方面的考虑,在缺乏统一标准的时候,选择公认的协议是开发人员在进行开发时所做的常见选择。在图书馆利用Mashup进行跨界合作缺乏统一标准的情况下,使用已经得到广泛应用的、公认的或事实上的标准,而不是生僻的协议和数据格式将使得跨界合作更容易实现。
3.2 积极与对方沟通,尽量使用API接口
Mashup得到广泛应用的一个重要的基础是信息机构公布了自己的APl接口供他人调用。但是互联网上的信息资源在很多时候并不提供API接口供他人调用,这就需要分析信息源的程序代码提取出可供使用的隐藏着的API,但这也容易侵犯对方的知识产权。另外一种方式是通过屏幕抓取方式提取出可以通过编程使用和操作的信息及语义结构。但是这种方式由于信息的消费者和提供者之间缺乏有效的沟通,往往在信息提供者修改了页面的视觉效果时,屏幕抓取方式不能及时随之改变而导致针对该页面的屏幕抓取失败。同时采取屏幕抓取技术还会对信息所有者的服务器造成负担,甚至引起知识产权和法律权益等方面的纠纷。
在获取数据源的数据信息时尽量使用API的方式获取对方站点的数据和服务,包括隐藏在程序代码中的API,尽量避免使用屏幕抓取的方式实现数据和服务的调用,在不得以使用屏幕抓取技术的同时要确保不会对对方的服务器造成负担。在必要的时候要联系站点所有者,获取对方许可,确保不会引起纠纷。
3.3 研究语义模型,提高合作质量
图书馆不同数字系统之间以及与其他机构之间的合作究其本质就是数据和信息的共享。在这一过程中,不同系统和机构之间由于缺少数据和数据映射不完整、数据不适合进行机器自动化处理以及由于获取数据必须采用屏幕抓取技术而引起的数据污染等问题外,主要问题是语义和数据的质量“。因此,图书馆在开展跨界合作服务时,在技术上应该对构建语义模型进行深入的实践研究。
Mashup使用来源于各种机构、组织或个人的数据,开发者对源数据语义的理解是否准确,异构数据模型的转换、映射是否完整、真实,开放的数据提供带来的数据污染等都可能造成Mashup的工作失败。因此,Mashup与语义网的结合成为信息服务中的研究热点,目前Mashup只通过语法和结构上的方法很难做到数据的互操作和集成,而语义技术通过使用元数据对数据进行增强,从而使数据变得有意义,最终使数据变得适合进行自动化Mashup。在使用Mashup时,语义网和RDF可以帮助实现高质量的XML数据聚合和RSS提要内容聚合。使用语义技术和RDF可以让Mashup用户更好地控制服务、信息和表示,高效地创建Mash,up应用程序。目前,有研究者提出了名为SA-REST框架的解决方案,在基于REST服务中增加语义注释,这种语义上的服务对于创建动态的Mashups(sMashups)提供了更好的支持。在基于Mashup技术的图书馆跨界合作服务中应用语义模型进行图书馆与其他信息服务机构的跨界合作对于提高合作质量有重要作用。
3.4 利用网络社区力量,借鉴成功经验
当利用Mashup技术进行图书馆与其他领域的合作时,从理论的角度看是有可能的(只要有时间、有精力、并掌握了相应的资源),但是实际上却无法实现,尤其是一个人的力量时。图书馆提供信息服务的性质是公益性服务,提倡的是无差别的免费服务政策。而与之进行合作的其他信息服务机构往往是以商业盈利为主要目的,讲求的是利益优先。两者之间的文化差异必然会为其开展跨界合作服务带来诸多难题,如技术标准、知识产权、用户隐私等。利用网络社区与他人进行沟通交流,对于这些问题的避免有一定的积极意义。
图书馆利用Mashup技术开展跨界合作时,通过网络社区学习他人的经验通常意味着可以与其他开发者合作,共享他人的成果,从而节约大量的时间、精力,保证合作的质量,从最大程度上避免其他因素的干扰而导致合作无法进行。
3.5 注重知识产权,探索互利模式
利用Mashup开展跨界合作,必然要涉及到信息的版权保护。Mashup技术的信息来源于不同的机构,其作为缺乏合适的API信息获取技术补充之一的屏幕抓取技术本身就存在侵犯知识产权的隐患。由于Mash―up开发者可能以未获得API内容提供者批准的方式使用对方内容,在进行合作时,做好与对方的沟通工作尽量避免纠纷是十分必要的。同时,造成知识产权纠纷的一个重要因素是利益的分配问题。图书馆跨界合作通过形成合理的互利模式,利用对方的优势满足自己更多的利益,将为解决图书馆跨界合作中的知识产
权纠纷提供途径。
谷歌图书馆计划由于侵犯了作家和出版商的利益而赔付1.25亿美元达成和解,而经过该事件,谷歌与作家和出版商也达成了双方合理分享利益的方案。随着互联网信息检索技术的日趋完善,信息搜索引擎的服务内容和范围也与图书馆逐渐靠近,这些拥有优秀人才、资金和技术的互联网信息服务商,虽说在初期阶段会因为各种原因(如版权问题)而制约其发展,但是随着服务模式的不断创新,必将对图书馆形成挑战。因此,探索合理的互惠互利模式是图书馆利用Mashup开展跨界合作的必然选择。目前,在Mashup的相关应用领域尚未形成明确的商业盈利模式,如何使合作的双方都获得利益,将直接影响信息服务机构向Mashup领域发展的意愿。在图书情报领域,利用Mashup技术与其他机构进行合作从而盈利的成功应用范例还没有出现,但是已经出现了一些相关研究。在窦平安等人的研究中提出,广告支持期刊开放获取和图书免费阅读,图书馆加盟网上书店的盈利模式为利用Mashup技术开辟网上信息资源跨界共享提供了参考。
3.6 兼顾旧读者,做好读者宣传工作
图书馆在利用Mashup技术开展跨界合作服务帮助图书馆延伸服务空间时,一些读者可能更愿意使用原有的服务方式或习惯来获取图书馆的信息。因此,在使更多的读者获取图书馆新开展的服务时,并不意味着图书馆就能直接放弃原来的服务方式,图书馆要照顾到读者旧的使用方式。
图书馆通过开展跨界合作服务,除了要求技术人员对自身的图书馆系统有深入的了解,对Web2.0的理念以及Mashup技术和相关工具有一定的认识外,读者对新开展的服务的认识和了解也是很重要的。图书馆的信息服务工作应用一项新的技术能否成功,需要以读者的使用情况来作为检验的标准。因此,图书馆在应用Mashup技术时,还要做好营销和宣传工作,使更多的读者了解新的技术带来了哪些方便,从而吸引更多的读者去使用,去参与。只有读者了解了一项新技术的使用方法,才能使之应用成功成为可能。
4 结语
图书馆只有抓住自己的资源和服务,将互联网和用户作为整体来研究,以灵活、开放的心态在系统开发、用户研究和资源建设中注重分享与合作,才能使图书馆服务水平不断提升,吸引更多用户。虽然,Mashup技术在图书馆的应用现在还比较简单,但是随着研究的深入,必将为图书馆融合更多的信息资源、更多他人的优势提供便利。
转载注明来源:https://www.xzbu.com/1/view-152420.htm