从资源出发的面向用户群的高校图书馆资源推荐模型分析
来源:用户上传
作者:
摘 要:从高校图书馆的实际情况出发,从资源和用户两方面着手,将资源按主题划分并把读者按兴趣特征划分用户群从而实现把主题资源推荐给相应用户群的高校图书馆资源推荐模型。资源主题划分越细致,相应的读者的兴趣用户群划分就越细致,从而资源推荐系统的个性化程度越高,推荐质量和满意度就越高。
关键词:资源推荐;高校图书馆;用户群
中图分类号:G258.6 文章编号:2095-624X(2019)17-0034-02
一、背景
信息大爆炸的时代,图书馆资源受到海量碎片化信息和电子化图书期刊资源的冲击。一方面碎片化信息占据了读者业余时间的绝大多数,减少了读者对图书馆资源的获取意愿;另一方面出版业的繁荣,电子图书期刊数据库的发展使得读者有多种途径获取资源而不必局限于图书馆。同时,图书馆本身的馆藏资源也日益丰富从而面临信息过载和数据丰富而信息匮乏[1]的问题。
高校图书馆作为校园文化的核心载体,其丰富的馆藏资源不仅要为广大师生提供学术研究的支持,还要承担起校园文化建设,提升读者文化素养,加强文化凝聚力的责任。而旧的被动等待读者主动借阅的服务模式已经无法实现图书馆的应有价值。面临时代挑战,在图书馆升级转型的过程中,资源推荐系统由于能在一定程度上加大需求,提升资源使用率而受到了各大图书馆的青睐。事实上,资源推荐系统帮助图书馆在服务过程中变被动等待为主动推介。读者即使没有主动去搜索图书馆的资源也能获得图书馆资源的推荐,从而提升读者对图书馆资源的获取意愿,进一步提升图书馆的资源使用效率,帮助图书馆实现自身服务价值。但在实际使用过程中,严重依赖图书管理集成系统的资源推荐系统智能化、系统化程度有待提升,而用户一方面对系统满意度不够,另一方面担心个性化的推荐系统侵犯个人隐私[2]。关于高质量的图书馆资源推荐系统的进一步的理论研究和实践探索有重要的实际意义。
二、综述
关于图书馆的资源推荐系统有大量研究。基于主动推荐从而提升馆藏资源使用率这一基本逻辑,研究者们讨论了各种非个性化和个性化资源推荐。王旭等提出图书馆资源虽然有范围小、时效性低的缺点,但其专业性和高质量等特点仍然是不可替代的优势。因此他们提出了针对高校图书馆的面向资源的资源推荐服务方法,立足馆内资源,整理后主动推送,以更好地服务读者。王庆等讨论了利用用户画像从用户视角分析资源的需求,从而实现图书馆的资源推荐。黄凌云从目前图书馆信息系统获取读者需求信息不足的痛点出发,提出利用网络爬虫技术采集读者特征和需求,从而实现资源推荐。依托该模型构建的推荐系统经过十轮实验,通过调查报告的方式发现该模型满意度大大超过了仅采用读者图书馆历史行为数据构建的推荐系统模型。马丽从用户评分数据稀疏的现实出发,指出基于用户的协同过滤推荐算法面临评分矩阵R(m,n)维度高而矩阵元素值稀疏从而推荐质量低下的问题,并提出建立“群体兴趣偏向度”来估算用户未评分项数值,从而有效提高基于用户的协同过滤推荐算法的推荐质量。姚望设计的面向学生的高校图书馆图书推荐系需要对图书的流通日志进行分析进而根据年纪专业等对读者进行推荐。
总体来说,大多数关于图书馆资源推荐系统的研究都关注资源或者读者其中一面来试图提升推荐系统的质量和满意度。而高校图书馆的资源推荐系统较其他领域的推荐系统有其特殊性。一方面高校图书馆的资源是针对本校科研、教学采买的,馆藏资源与其读者的契合度相对较高。另一方面对应的高校图书馆面对的读者从年龄、教育程度、专业等方面具有稳定的群体聚集性。从这点出发,笔者针对高校图书馆,研究把馆藏资源按主题筛选分类并推荐给按兴趣特征划分的读者群,从而实现较高质量和可行性的资源推荐。
三、思路方法
1.馆藏资源按主题筛选分类
按主题筛选分类馆藏资源可以有效解决图书馆面临的数据丰富而信息匮乏的问题。笔者构建的资源推荐模型先需要立足于高校图书馆,将馆藏资源按主题筛选归类。而高校图书馆的特殊性在于其服务于教书、育人、科研的使命使得其馆藏资源的采购具有专业性、指导性以及受众的稳定性,即它的资源从采购开始就是针对其相对稳定的读者,契合度较高。在对资源按专业、类别等选定主题后,设计算法,利用关键字、出版社、作者等信息作为抓取目标,从海量资源中选择出符合主题的条目。利用数据聚合手段进一步获取更多主题类资源。获得主题类的资源后,对无序的资源将资源评分、质量和主题相关度等加权评估作为排序依据。
2.读者群体的划分
高校读者群体的稳定群体聚集性使得我们的读者群先是在一个相近的受教育程度和文化素养条件下。第一步按照专业、年级等将读者进行分类。在这个分类下,关于学生专业的教学和科研领域类的资源可以作为契合资源进行匹配推荐。具体来说,馆藏资源里相对应的专业相关的主题图书按照年级、研究方向等可以与之匹配推荐。进一步的群体特征划分需要通过主动抓取隐性信息或者通过读者自主选择来实现。主动抓取隐性信息包括通过历史流通数据获取读者感兴趣的类别,而两个兴趣相近的读者群对同一资源主题感兴趣的概率相对要大,这也帮助图书馆在做群体划分时规避一部分读者担心的隐私权的侵害问题。设计兴趣主题模块供读者主动选择则使得对读者按兴趣划分到特定的用户群这一事件更加简便。实际运行中应该主动抓取隐性信息和鼓励读者自主选择。
3.资源推荐
完成资源的主题分类和读者的用户群划分后,相应的主题资源可以直接推送给相应的用户群,从而实现资源推荐而提高资源的使用率。事实上,主题划分得越细,相应的读者群的划分就越小,从而资源推荐系统的個性化程度就越高。资源推荐的效率、质量和满意度也会同时提升。
四、不足与建议
在推荐系统使用更加成熟的领域如网络购物平台,推荐系统主要采用的还是非个性化和半个性化推荐,而完全个性化的推荐迟迟没能实现,除了技术手段的问题外,还涉及用户隐私权的问题。本文中提出的将馆藏资源和读者群体分别分类划分从而实现资源推荐的模型虽然在一定程度减轻了用户对于隐私权被侵犯的担忧,但是资源推荐的精准度有赖于更精确的主题和读者兴趣类别划分,这需要读者主动选择兴趣模块。接下来的研究试图构建出具体的馆藏分类算法实现资源按主题分类,并通过迭代逐步细化主题,相应细化读者群的划分,从而实现更加个性化、高质量的高校图书馆资源 推荐。
参考文献:
[1]张文华,胡春,胡光林,等.基于图书馆流通数据的聚类分析研究[J].农业图书情报学刊,2010(10):109-111,130.
[2]李民,王颖纯,刘燕权.“211工程”高校图书馆馆藏资源推荐系统调查探析[J].图书情报工作,2016(9):55-60.
作者简介:张果(1990—),女,助理馆员,硕士,研究方向:高校图书馆智慧化转型。
转载注明来源:https://www.xzbu.com/1/view-15023549.htm