您好, 访客   登录/注册

标注及其演化研究

来源:用户上传      作者:

  [摘要]探讨标注的概念,分析印本形式标注的种类与作用,数字形式标注在计算机领域和数字图书馆领域的应用,重点剖析大众标注概念的内涵、应用、不足和发展态势等。
  
  [关键词]标注演化大众标注印本形式标注数字形式标注
  [分类号]G250.76
  
  标注古已有之,在计算机出现之前标注都是由手写完成,人们往往通过标注来表达自身的阅读感受与观点态度,同时也方便日后查找,这是标注最基本的功能。进入计算机时代,数字形式的标注随之出现,使得标注的功能已经不仅仅局限于满足阅读者个人的需求。大众标注(follksonomy)这一体现着第二代互联网功能特征的网络信息技术的出现,从本质上改变了传统标注的方法、性质、功能和作用,对标注这一古老的活动赋予了全新的内涵。
  
  1 印本形式标注及其作用
  
  在其发展早期,标注表现为手写形式,出现在书本页面的空白处,其功能主要是对文本内容进行注释,或者是阅读者对阅读内容发表的观点、体会等。此种标注多数不具备标引文献内容的功能,但有些标注是与标注对象具有逻辑关系的词语,这种标注已经具备了一定的标引功能,有利于提高查找文献的便利性和效率。
  
  1.1 印本形式标注的种类
  在中国,标注主要产生于两个方面:①在对经典名著或古籍资料的解读过程中产生的,如一些名著的批注本;②应用于学习之中的,用于注解阅读内容,如在学习文言文过程中对字、词、句含义的注释,在学习语言过程中对单词、语法等的注释等。古籍注释是我国古代文化赖以传承的一种主要方式。出现于汉代的某些古籍的书面语注释,如注解《诗经》的《古训传》、注解《春秋》的《公羊传》等,可以说是古籍注释的先驱。
  在学习方面,较为普遍的注释是读者在阅读过程中进行的批注,其作用是帮助自己掌握书中的内容。批注是我国文学鉴赏和批评的重要形式和传统的读书方法,其内容往往是与所读内容较为贴切的短语断句。根据批注出现的位置,可以将之分为“眉批”、“旁批”和“尾批”等。其类型主要包括注释、提要、批语、警语等。批注的主要功能体现为阅读者对自身感受的笔录,体现着阅读者别样的理解、体会和情怀。大部分批注只是表达阅读者的观点与态度,而不直接揭示文献的内容,基本不具备检索功能。
  此外,中国封建社会皇帝对各类奏章所进行的批注,则是印本形式标注的另一种表现形式。这种批注是皇帝阅读奏章过程中意见的表达,是皇帝发布命令的一种方式,一般不直接揭示奏章的内容,当然也不具备标引功能。
  
  1.2 印本形式标注的作用
  印本形式标注是读者阅读文献的一种反馈,通常也为其他读者利用文献提供了一种线索或指导。标注作为阅读与思考结果的一种呈现方式,在一定程度上体现或蕴含了读者对文献的利用方式、利用过程和利用结果,表明该文献或该文献的某一部分在解决读者的疑问,满足读者的需求方面发挥了作用。表明读者通过对所读内容的学习和理解,结合其自身的知识结构和知识积累,得到了某些启迪和借鉴。这些标注不仅有助于读者以后再次利用文献,对同一文献的其他读者来说也具有参考价值。
  
  2 数字形式标注及其应用
  
  随着计算机技术的迅速发展,标注开始从印本形式发展到数字形式。用户可以在数字空间中借助计算机随意创建、修改和删除标注,为日后自己或他人重复利用同一资源提供便利。
  
  2.1 计算机领域数字形式标注及其应用
  国外有关学者研究表明,在计算机领域,首次采用标签(tag)方式进行标引的文件系统是微软的DOS系统。1986年施乐公司构建了一个用于标注和编辑语音记录的原型系统,该系统允许用户为文档添加语音标注,同时也允许用户为语音片段添加文本标注,作为标识其内容的线索。此后的十余年中,计算机界的研究人员在这一领域进行了不懈地努力和探索,他们对印本环境中用户的阅读行为和标注活动进行研究,发现标注是思考性阅读过程的一个组成部分,它对资源的后续使用者更为有效地利用该资源具有一定的参考作用。基于此,人们开始尝试在数字环境下模拟印本的阅读环境,开发应用于不同平台,面向不同媒体格式的数字标注系统,如用于标注网页的ComMentor、Annotator、ThirdVoice、Cdd,mk、CoNote、Futplex等,用于标注电子邮件的Tapestry,用于标注文本文件的Acrobat、MicrosoftWord、SemanticWord,用于标注PowerPoint文件的Briefing Associate,用于标注多媒体文档的Dynomite,用于桌面计算机系统的Xlibris,用于手持设备上的标注系统Notable,可同时用于桌面计算机和手持设备的NotePals,实现交互式教学的Classroom2000,支持个性化标注的Yawas等。这些系统从不同角度对印本文献的阅读环境和工作环境进行模拟与再现,利用计算机和网络的强大功能拓展这一环境,实现交互式阅读和用户之间的协作。
  
  2.2 数字图书馆领域数字形式标注及其应用
  20世纪90年代,在数字图书馆概念形成之初,人们就开始考虑如何在数字图书馆中引入数字形式标注功能。1997年,施乐公司的研究人员根据对特定印本环境中标注(大学校园中教科书内的标注)的研究,探讨了在数字图书馆中引入数字形式标注的意义和面临的问题。人们列数字图书馆和协作服务中的标注进行了研究,从元数据、内容、对话行为三个角度来分析标注,阐述了标注、数字图书馆和协作服务之间的关系,探讨了利用标注为用户查询相关文档的搜索策略。互联网的发展带来资源的分布和异构,由此引发的另一个问题是如何从这些分布、异构的资源中无缝地检索和获取资源。为了充分利用科研人员的标注成果,人们还研究了如何通过外部的、概念化的标注来整合科学数据,提出了相应的模型框架。采用分层数据存取服务的方式,实现了对科学数据的数字化标注。
  
  2.3 数字形式标注的发展
  随着互联网技术的发展,人们对标注的研究开始突破系统/工具的开发或整体研究的范畴,向着更为深化、细致的方向发展。这主要体现在以下方面,①对在不同系统或不同表现形式下标注的适应性进行研究,当用户改变浏览器窗口的大小时,标注的内容会随之改变,以适应变化后的内容版面。②关于识别手写符号的研究,开发出的许多工具或系统,用以解决对笔式工具所形成结果的识别问题。③进一步扩展了标注的研究对象,包括自动抽取文档中的标题、作者等特征项,为它们加上不同的指示符号等。同时,开始研究对新格式、新协议的支持和应用等。④关于语义标注的研究,随着语义Web的出现,语义标注也开始出现,相应的出现了支持语义标注的系统和工具。
  
  3 大众标注的内涵及其应用
  
  近年来,基于网络的数字形式标注正在成为一种时尚的

大众网络行为。尤其是,随着浏览器功能的日益强大,数字形式标注的使用也更加普遍,操作更为便捷。大量应用系统的出现,逐步形成一种由用户参与建立起来的、互动的学习,交流和共享环境。大众标注应运而生。
  
  3.1 大众标注提出的背景
  在大众标注的概念提出之前,人们总希望文献的组织有条不紊,最好是全国乃至全世界都使用统一的信息组织标准,可是这种大一统的理念和做法却束缚了信息组织的灵活性和个性化。blog、wiki等完全平民化的信息发布渠道异军突起,打破了以往只能由少数新闻传播机构或者少数信息服务机构发布信息的格局,大众由单纯的信息接受者逐渐发展成为信息接受者与信息发布者的统一体(prosumer)。网络已经成为人们抒发情感、张扬个性的最佳渠道。人们在不断创造信息的同时,也需要按照自己的需求,以不同的方式有效地组织各类信息。于是,不受传统信息组织规范约束,完全出于个人喜好的标注方式,逐渐成为人们推崇的数字信息组织的主要方法。Joshua Schachter开发的del.icio.us系统(网站)于2003年底投入使用,向用户提供在线标注网页的服务,促进了大众标注实践活动的开展。随后,基于大众标注的信息组织理念迅速被人们应用到其他系统之中,涌现出一大批支持大众标注的网站。2004年底,Thomas Vanderwal首次以folksonomy这一词汇形容大众标注的概念。目前,大众标注已经成为人们对网络资源自由标注、自由分类的专业术语。
  
  3.2 大众标注的内涵
  针对大众标注概念的内涵,许多学者进行了深入研究,其中最具代表性的观点有如下一些:
  大众标注是一种分布式的,大众在线创建数字对象元数据的方法;
  大众标注是一种技术,也是一种理念。大众标注可以起到分类的作用;
  大众标注是数字对象使用者赋予数字对象文本标识的一种组织机制;
  大众标注是一种基于因特网的信息检索方法。该方法以合作创建的、不受限制的标签为基础,并通过标签来类分网页、在线图片和网络链接等数字对象;
  大众标注是由用户创建的分类法,使用不受限制的标签来类分和检索各种网络资源。
  综上所述,笔者认为,大众标注是网络资源的利用者为了组织和利用某一数字资源,而自主地对该资源赋予标签的过程或结果。从这一角度上理解,“folksonomy”应该被视为一种大众性的、自由式的标注,将“folksonomy”译为“大众标注”似乎与原文内涵更为贴切。
  
  3.3 大众标注的应用
  大众标注的应用呈现出一种扁平的结构,作为标注词的标签不受任何限制,标注内容与标注对象之间的关系并不明显,而且不需要形成一个严密的概念体系。任何人都可以创建、选择自己喜欢的标签,新标注的引入随时可以进行,每一个被描述的对象在理论上可以拥有数量不受限制的标签,使用者不用接受专业培训,而且标注的过程完全可以随,心所欲。标签并不能等同于传统信息组织中使用的关键词,对于同一个数字对象,不同用户可以根据其自身需要,使用数量不等,形式各异的标签进行标注。用户可以随意对自己账户中的标签进行增删和修改,十分方便地利用标注系统管理自己的文章、图片、音乐和共他数字资源。在个人网络信息资源的组织与管理方而,大众标注已经成为一种时尚。
  
  3.4 大众标注的不足
  大众标注具有许多优点:使用成本低,简单,可扩展性好,可重新组织网络资源,快速反应用户需求,社群的信任,用户拥有个人独立的空间,能够提供及时的反馈等。由于具有大众性、自由性和非专业性等特点,使得大众标注自出现伊始就受到广大网民的喜爱。可是经过一段时间的发展,人们发现对于同一内容的描述与组织,往往由于标注者的知识背景和喜好的不同而大相径庭,用户在不同年龄段对同一标注对象使用的标签会有所不同。很多人使用标签只是基于当前的需要,他们一船不会老虎其自身以后的需要,或者其他人的需要。在大众标注系统中很多标签只被使用过一次。如dei.iciolus的统计表明,在用户提供的20万个标签中,有19万个标签仅被使用过一次,标签对资源查找的支持效果不佳。尽管支持大众标注的网站系统可以将用户使用过的所有标签都加以保存,并作为检索点提供给用户浏览或检索,但其结果却往往导致信息的泛滥和查全率的降低。国外学者研究表明,大众标注存在标签滥用、标准缺乏、信息检索效率低,用户之间难以理解对方的标签,系统不能为用户提供同义词词典等缺点。此外,大众标注还存在标签语义模糊,同音异义词、同义词、方言的使用难以有效控制,标注缺乏秩序,逻辑关系不明确等问题。
  
  3.5 大众标注的最新研究进展
  随着大众标注应用的不断深化,人们开始探讨如何提高标注在资源查找、发现、利用和共享等方面的价值与效率。标注的目的乃是为下一次查找与利用提供便利,如果标注不利于高效查找,其意义将大打折扣。大众标注经过一段时间的发展后,开始走入非完全自由标注的阶段了。多数支持大众标注的网站往往会在用户输入标签时,提示并推荐他们认为更适合用来标注该资源的标签。其后台实现方法是,以自动统计的方式,将同一含义并且使用频率较高的标签推荐给用户。尽管用户在标注网络信息资源时可以做到随心所欲,但是由于标签的使用不受限制,使得基于大众标注组织起来的各种网络信息资源查找起来相当困难。为了做到既保持用户自由标注的优点,又能使之以更高的效率支持用户查找和发现信息,进入2007年,SamanthaHastings、HemalataIyer、DianeNeal、Abebe Ronssa和JungWon Yoon等人就如何构建具有高效查找与搜索功能的大众标注系统开展了一系列研究。
  ManekeGuy等撰文指出,对用户进行有关自由标注方法的教育,可以提高大众标注的资源组织效率。用户的标注方法教育可以包括但不局限于:标签不要出现拼写错误,词语的合成要符合规则,注意作为标签的词语在语态、格和单复数的不同形式,不要采用过于个性化的词语作为标签,不要使用那些在标签数据库中只出现过一次的标签等。MichaelPeinhopf认为,改进大众标注的方法可以包括:提供一组受控的词语列表,让用户只能在系统提供的词语列表中选择词汇进行标注。建立同义词控制机制,即当用户输入某一词语作为标签时,同义词检验系统会即时提醒用户使用更为适合的词语。基于标签的语义关系,构建被标注对象之间的联系,提高标注系统的信息组织功能,以及提高用户的标注素养等。
  
  4 结语
  
  如何充分发挥大众标注的作用是一个值得思考的问题。大众标注的最终目标无非是为了实现更广泛、更便捷的信息 共享与交流。但是,高效率的共享与交流往往要求使用大量为普通大众所共同认可的标签进行标注。这将要求对标注活动加以规范,而规范势必限制自由。大众标注从出现伊始就以完全尊重信息用户的个性化标注意愿为出发点,这是其最本质的特色。因此,规范的推行有可能使得大众标注在很大程度上将不再是“大众”标注。大众标注下一步如何发展,我们将拭目以待。
  


转载注明来源:https://www.xzbu.com/1/view-154713.htm