您好, 访客   登录/注册

基于读者行为特征的数据库购买决策研究

来源:用户上传      作者:

  [摘要]针对高校图书馆专业性数据库购买的目的和决策压力,为保证学校、图书馆、读者三赢的局面,以古籍数据库为例,采用观察、面谈、试验、比较等方法,总结读者对纸质文献与古籍数据库的利用行为特征,并统计古籍数据库与纸质文献的重复程度和投入产出情况,为古籍数据库的购买决策提出建议。
  [关键词]专业数据库
  古籍数据库 数据库采购
  决策咨询 行为分析
  [分类号]G253.5
  
  1
  引
  言
  
  对专业性数据库的购买,图书馆往往依据相关院系领导、学术带头人的推荐,根据资金情况,尽力予以解决,出现“撒面面药、全盘兼顾”的现象。这样尽管照顾了绝大多数院系情绪,但可能因为资金压力,导致大多数数据库质量低劣而“得不偿失”,学校、图书馆、读者三方皆输。近年,不少高校日益关注“投入产出”问题,加大图书馆投入的同时,对其“产出――对教学科研的支撑”的审核越来越严格,因而图书馆在数据库购买决策时,不得不根据学校的这一方针变化进行重新考虑。
  本文针对高校图书馆面临的新压力,以某高校图书馆购买古籍数据库为例,采取观察、面谈、试验、比较等方法,从读者行为特征角度为专业性数据库的购买决策提供事实证明和咨询意见。
  
  2 古籍数据库购买决策论证的内容
  
  专业性数据库往往有利于解决信息延迟(如化学文摘cA)和弥补纸质文献的不足(如国研网),当然,和综合性数据库类似,也可以通过专业性数据库全面跟踪该学科或主题的研究进展。但对于古籍数据库而言,一方面,其内容都是1D0年前的文献,因此,不存在解决信息延迟的问题;古籍数据库不收录现代某个学者的研究论文,想通过它来跟踪某个学科或专题(比如甲骨、音韵)的研究进展,也无法实现。因此,购买古籍数据库,往往是为了弥补纸质文献的不足,从而解决教师和学生阅读的基本需求,但若某馆已购人大量纸质再版古籍文献(如四库全书、地方志集成、再造善本),解决师生的阅读需求这一功能也并不突出。另一方面,众所周知,因为古籍文献的特殊性,使用频次本身不高,研究者并不多。而目前国内已有的“中国基本古籍库”和“龙语瀚堂典籍库”两个古籍数据库,价格都不菲,为少数几个专业、几百个人花费如此巨资购买专业数据库,是否有必要,是图书馆和主管校领导担忧的问题。另外,如果要购买,则购买哪家或者先购买哪家,都必须科学论证,全面衡量。
  我们针对某高校图书馆已有大量再版古籍,而且再版古籍基本已完成“子目”的编撰工作这一事实,经与该馆信息咨询部协商后,确定古籍数据库购买论证务必包含以下内容:①院系领导和学术带头人书面意见;②与纸质文献重复率,两个数据库之间重复率;③读者利用数据库的情况,含访问量、下载量等;④读者利用纸质文献情况,含未满足率;⑤其他高校购买情况以及价格。并且一致认为,对读者行为的观测和总结分析,是本次论证的关键,至少关系到究竟先购买谁或不购买谁的决策问题。基于此,笔者等人与该馆信息咨询部共同拟定了跟踪调查相关读者行为的思路和方案,如表1所示:
  
  
  3 古籍文献读者行为分析
  
  自该馆将古籍数据库的购买决策提上议事日程以来,阅览室就开始有意识观测、记录读者行为;并请“中国基本古籍库”、“龙语翰堂典籍库”分别在2008年9月、10月在该校开通试用,古籍阅览室读者检索机桌面新添加2个快捷方式图标,分别接入这两个系统,并安置Insight电脑屏幕智能记录软件,后台记录读者的点击、检索和阅读行为。
  
  3.1 读者到馆查阅纸质文献行为分析
  3.1.1
  检索和借阅行为
  2008年9月、10月阅览室共接待读者832人次,从中发现,63%的读者直接向工作人员索取某本书或者自主利用阅览室检索机检索信息后再行借阅;16%的读者经工作人员辅导后,能够通过读者检索系统确定自己需要哪一种书;约21%读者没有明确阅读方向。工作人员反映,正常情况下,不明确阅读方向的读者不到10%,出现21%的原因在于部分新人学研究生对自己的研究方向十分迷茫。另外,从咨询记录看,仅有6人次读者所需要“集部类”纸质文献该馆没有收藏,但在中国基本古籍库中有收入。
  3.1.2
  阅读行为 从文献外借归还(本馆线装古籍及再版古籍都是闭架阅览)时间以及通过摄像头和人工对读者阅读行为的观察分析:近6成读者往往花费2―3天或更多时间阅读某一种书;近3成读者仅仅花费1~2个小时浏览某种文献中部分内容(比如年谱、职官);近1成读者在40分钟内阅读归还某种文献,大多数是校对不同版本中某段话不同的表述,或者是因论文参考文献需要注明版本目录信息而再次翻阅。
  
  3.2读者到馆查阅电子文献行为分析
  3.2.1检索行为 通过对读者检索机565份间断性Insight记录的分析,我们发现,38%的读者对这2种古籍数据库毫无兴趣,直接检索馆藏OPAC系统、抄写索书号后借阅纸质文献阅读。19%的读者接入数据库,尝试检索文献信息后,迅速转移到OPAC系统;近41%的读者检索文献信息后,复制少量内容后离开;约2%读者花费2个小时或更多时间进行电脑“阅读”。其间,有约9%的读者通过Baidu、Google等搜索引擎检索文献信息。
  3.2.2
  阅读行为
  经过与借阅记录、咨询记录、摄像机对比辨认,发现电脑阅读的读者正是上文提及的6人次未找到纸质文献者。而41%从数据库复制少量内容的读者,都在当天或次日借阅纸质文献阅读。观察发现,他们需要再次根据纸质文献校对数据库中内容的准确性(字、行)。
  
  3.3
  读者网络查阅电子文献行为分析
  从两家数据库厂商的记录来看,9月1日~28日中国基本古籍库访问数量为544人次,10月7日~31日龙语瀚堂典籍库访问数量为203人次。可惜的是,2家公司都无法提供IP地址以确认读者属于哪个群体(教师、研究生或图书馆工作人员),更无法判断读者是属于“检索”还是“阅读”,但“龙语瀚堂”发现有恶意下载全文的现象,曾提出警告并封用户IP。
  
  3.4 读者日常阅读行为跟踪分析
  经过对历史文化学院研究地方志、明清史,文献所研究甲骨、音韵,文学院研究唐诗歌、明小说的导师共6人的访谈获悉,自古籍数据库试用开通后,他们也曾在古籍数据库中搜索某个专题的文献,从而判断是否有自己尚未闻及的文献,但他们首选是到图书馆来借阅纸质文献,如某位喻姓教授所言:“古籍本身无标点断句,字迹模糊,电脑上看,异常吃力”;“课题中不能以数据库作为文献来源,必须是纸质的”。对于在数据库中“复制”少量内容,他们不大赞同,因为数量很少,从数据库上复制过来,也必须与纸质文献校对,方才放心使用。若在该馆没有某种文献,他们一般通过Baidu、Google等搜索引擎获取纸质文献信息后,通过

朋友、学生等关系在其他机构进行复印或代为核对阅读。对7位熟识的研究生和3位博士生进行访谈,也发现了类似的行为特征。
  可见,该校古籍文献的读者有57%基本不需要、不适应或者尚不知道该馆正在试用古籍数据库,而剩下43%中的95%的读者最终也必须获取纸质文献。综合纸质文献读者行为,笔者认为,该馆纸质文献应该能满足90%以上读者的需求。
  
  3.5
  古籍数据库试用结束后的读者行为对比
  10月国庆假期结束,中国基本古籍库停止试用,截至10月20日,仅3位(未能获取纸质文献的)学生对“接人不了”表示遗憾;11月1日,龙语瀚堂典籍库试用结束,截至11月7日,仅1位研究魏晋石刻方向的毛姓教授“抱怨”自行造字困难,“龙语瀚堂异型字、怪体字都造好了,多方便啊”。可见,绝大多数读者对古籍数据库的存在与否并不在意。当读者无法接人古籍数据库时,Insight记录发现,他们利用Baidu、Google等搜索引擎查询信息的频次明显增加。
  
  4 重复率分析及院系意见
  
  鉴于读者更倾向于使用纸质文献这一事实,笔者建议核实两个数据库与目前馆藏文献的重复程度,并比较两个数据库的直接差异。
  
  4.1
  古籍数据库与纸质文献的重复率
  该校设置有“汉语言文字学”、“语言学与应用语言学”、“中国古代文学”、“中国古典文献学”、“中国古代史”、“专门史”、“历史地理学”、“中国少数民族史”等博士或硕士招生专业,所申请的国家级、省部级课题集中在唐宋文学、明清史、边疆志、甲骨、音韵等方向,基于此,笔者建议将中国基本古籍库重复率的范围圈点在“思想类一经学思想目”、“历史类”、“地理类”、“语文类”、“文学类”和“其他类一目录金石目”等类。为避免人为因素的影响,笔者请一个数学系学生在如上类中随机选择100种文献进行重复率检索。经过检索,表明该校纸质文献与中国基本古籍库的重复率达87%,与龙语瀚堂典籍库的重复率达76%。该馆工作人员反映,这个数值应该有3~5%的偏低,因为还有少部分文献的子目没有添加进OPAC系统。可见,两个古籍数据库的大部分内容该图书馆纸质文献都已经包含,是否耗费巨资购买数据库,确实需要斟酌。
  
  4.2 两个数据库之间的重复率
  将上述随机抽取的100种文献在龙语瀚堂典籍库中进行检索,82%都可获得全文信息。从两个数据库的资料看,中国基本古籍库侧重于“传世文献”,而“龙语瀚堂典籍库”侧重于“出土文献”,两者之间有一定互补性。但对于该校的相关专业而言,两者之间的重复率已经偏高。
  
  4.3 院系学术带头人意见
  咨询文学院、历史学院、文献所3个相关院系学术带头人的结果,文学院仅愿意对中国基本古籍库提供书面支持意见,而历史学院、文献所对两者都提供书面支持意见,文献所认为,应优先考虑龙语瀚堂典籍库。
  从收藏范围来看,龙语瀚堂典籍库所收藏内容仅及中国基本古籍库的五分之三,但从两个数据库的扩充性来看,中国基本古籍库不再进行添加,而龙语瀚堂典籍库如今正以四部丛刊为本子向“传世文献”迈进,据其资料估计,3年内其传世文献数量将达到中国基本古籍库水平。
  综合以上信息,笔者等人认为,两个数据库之间建议选购一种。
  
  4.4 性价比与投入产出分析
  中国基本古籍库10机版(即置于局域网,可供10个并发用户享用)报价130万,折扣后价格在115万左右,5机版价格在103万左右;龙语瀚堂典籍库镜像版价格在21万左右。从2个数据库的重复率来看,龙语瀚堂典籍库性价比明显高于中国基本古籍库。其次,从该校3个院所申请课题的数量和级别而言,文献所明显居于领先地位;因此,若购买龙语瀚堂典籍库,则投入产出比较高。
  
  5 对古籍数据库购买的建议
  
  基于对读者行为的观察、观测、试验,笔者发现,该校古籍读者普遍不认可电脑阅读这样一种阅读方式;而通过日常服务咨询来看,该馆纸质文献已经能满足90%的读者需求;重复率的统计表明,两个古籍数据库-中80~90%的内容该馆已经购入纸质文献,两个古籍数据库之间重复率达到82%。因此,针对该校而言,首选是不购入任何古籍数据库,而采取与其他兄弟高校图书馆合作的方式,对少量读者需求的文献采取全文复制的方式传递回来。次选是优先购人龙语瀚堂典籍库,经济实惠,而且可以与其他高校图书馆交换“出土文献”部分资料,实现互补;在购买龙语瀚堂典籍库过程中,建议对其2―3年内的“传世文献”的补充部分进行价格约束和服务约束。若因其他原因需要购人中国基本古籍库,根据该校读者规模,建议订购5机版。
  
  6 结语
  
  综合性数据库(如CNKI、EI等)因为其学科门类广,使用者众多,使用效果有口皆碑,图书馆购买决策的风险不大。而专业性数据库使用者少,自身影响往往不大,图书馆购买决策时,不得不顾虑投入产出以及院系平衡问题。若遇到一个学科有多个数据库时,图书馆更不得不小心从事,以创造一个学校、院系、读者三赢的结局。本文尝试利用行为分析的方法,有意识有针对性地进行日常记录,对专业性数据库的购买决策进行了研究。但本文研究对象乃使用群体十分稀少的古籍数据库,其研究方法和研究程序,是否适合其他专业性数据库,还需要进一步论证。
  致谢:本文研究过程,获得该图书馆同仁和院系相关师生的帮助,在此一并致谢;本文提出观点所带来的责任及风险,均由第一作者负责。


转载注明来源:https://www.xzbu.com/1/view-153585.htm