数据挖掘在高校图书馆个性化推荐服务中的应用
来源:用户上传
作者:
摘要:文章以数据挖掘在高校图书馆个性化推荐服务中的应用为研究对象,首先对据挖掘应用于高校图书馆个性化推荐服务中的必要性进行了探讨分析,随后讨论了数据挖掘技术在高校图书馆个性化服务推荐中的应用,最后提出了数据挖 掘技术在高校图书馆个性化服务推荐中的应用实现方案,以供参考。
关键词:数据挖掘技术;高校图书馆;性化推荐服务;应用
中图分类号:TP311
文献标识码:A
文章编号:1009-3044(2020)04-0005-02
收稿日期:2019-11-25
在信息化环境下,人们获取信息的方式与途径越来越多,对于高校图书馆运营带来了一定的冲击与影响,需要高校图书馆提供个性化阅推荐服务,不断提升自身的服务水平。在这一过程中,数据挖掘技术发挥着重要作用。因此需要加强对数据挖掘在高校图书馆个性化推荐服务中的应用分析,对于推动高校图书馆实现可持续发展具有重要的意义。
1 数据挖掘应用于高校图书馆个性化推荐服务中的必要性
首先,数据挖掘能够有效提升高校图书馆藏书资源的利用率。随着信息技术广泛应用于图书馆数字化建设,使得图书馆藏书资源由纸质化逐渐向数字化方向转变。一方面这种转变为数据挖掘技术在图书馆个性化推荐服务中提供了良好的应用条件,另一方面也极大提升了人们利用图书馆藏书资源的效率,以往学生或教师到图书馆查阅书籍资料,需要人工查找、翻阅,费时费力,如今能够直接在线搜索图书馆数字化资源,使得图书馆藏书资源得到了更好的应用,有效提升了图书馆资源的利用率。
另一方面,面对高校图书馆用户信息需求日益多样化现状,必然需要应用数据挖掘技术才能更好地实现高校图书馆个性化推荐服务。如今随着高校数字化图书馆逐渐建设完善,在图书馆服务需求方面,主要呈现岀以下变化:一是用户主体变得多样化,信息化环境下,高校图书馆服务用户主体范围进一步扩大,不仅包括本校教师学生,还包括一些校外的用户;二是随着用户主体增加,相应信息服务需求也日益丰富;三是在上述情况之下,需要高校图书馆为用户群体提供多样化的服务形式与方式,因此为实现上述目标,必然需要应用大数据挖掘技术。
2 数据挖掘技术在高校图书馆个性化服务推荐中的应用
2.1 以关联规则为基础的推荐算法
在数据挖掘技术之中,关联推荐算法是其中重要的组成部分,该算法在各个领域之中均有着广泛的应用,其中最经典的是在零售领域中,对用户购物车分析应用。在高校图书馆个性化推荐服务中,通过应用关联规则推荐算法,能够根据用户查询文献的频率、数量、文献类别等数据信息,从中推算出用户查阅文献的规律,并在用户进行文献浏览、下载时,由系统自动向用户推荐类似的文献,更好地满足用户查阅需求。
2.2 以查询内容为基础的推荐算法
以查询内容为基础的推荐算法,即是结合用户查询的文献内容,寻找用户所查询的文献之间的相似性,并寻找用户已经评分文献内容,以此为依据,建立用户档案模型,然后从诸多文献之中,选择与用户档案模型比较类似的文献,将其中一些评分较高的优质文献推荐给用户。
2.3 协同过滤推荐算法
一是围绕用户的协同过滤推荐。在实际应用时,首先以用户对文献的评价日志为依据,完成用户间相似度计算,并根据计算结果,选择出与目标用户最相似的几邻居用户,然后参照邻居用户搜索内容喜好,完成向目标用户的推荐。
二是围绕物品的协同过滤推荐。该算法主要以用户使用过的不同物品间相似度为依据,来完成推荐预测。应用到图书馆个性化推荐中,便是围绕用户已评价的文献和待评价文献,查找两者之间具有哪些相似之处,并以此为依据,完成文献可聚类,可有效提升文献推荐的准确度,更加符合用户心意。
三是围绕模型的协同过滤推荐。这种推荐应用模式主要是对用户以往的文献查询数据进行学习,并建立一个用户模型,从中分析用户搜索规律与个人喜好,具体可借助概率模型、贝叶斯网络等数据挖掘技术,来完成用户文献推荐。
3 数据挖掘技术在高校图书馆个性化服务推荐中的应用实现方案
3.1 搭建云计算环境
由于高校图书馆大数据具有4V特征,即容量大(Volume)、速度快(Velocity)、多样化(Variety);四是真实性高(Veracity)。因此在进行云环境搭建时,可选择“成衫。叩”云环境平台。该平台釆用的系统为“HDFS”分布式文件系统,能够实现稳定可靠的数据云存储,并且平台之中融入了既a以内存计算技术与MapReduce映射制约技术,因此有着非常高的数据处性能。并且该软件是开源软件,不需要花费资金购买,能够有效实现成本节约。
3.2 具体实现方案设计
首先是线上部分。在数据收集上,利用“HDFS”分布式文件系统完成高校图书馆大数据存储。利用HBase數据库管理系统,能够对不同类型的图书馆大数据进行读写和随机访问。个性化服务算法应用,离不开用户行为数据支持,因此需要收集用户访问日志。在前端应用方面,前端主要负责各种网页或推荐请求接受,在经过初步处理后,会传递给后端引擎进行处理,在受到处理结果后,及时返回给用户。在云平台关联数据技术的帮助下,通过利用海量语义网知识库检索,从而能够为用户提供实时性、交互性个性化服务。
然后是线下部分:一是角色建模,这种建模具体分为两部分,一是用户建模,通过收集用户行为信息,完成用户模型的建立,并根据用户模型,来分析用户喜好;二是文献建模,主要是以文献领域属性、用户访问文献数据信息为依据,完成文献模型建立。在上述两种模型建立中,都能够依托于“MapReduce”计算框架来实现。并且在HBase数据库管理系统的帮助下,能够实现对模型的分布式存储和检索。在上述模型构建的基础之上,通过利用各种推荐算法,能够有效帮助用户找到自身需要的文献,提升个性化服务土建质量。“Mahout”是Hadoop与MapReduce计算框架的可扩展软件包,它在高校图书馆大数据处理上,有着卓越的能力。通过利用该扩展软件,能够促使高校图书馆个性化服务特点得以有效凸显。
最后是选择个性化推荐服务算法。在选择个性化推荐服务算法前,应注意做好用户常见内容特征与常见行为特征的分析。然后以此为依据,完成相应性化推荐服务算法选择。例如在选择协同过滤推荐算法时,需要结合实际,从准确性、高效性、稳定性三个角度,分析用户过滤推荐与物品过滤推荐在高校图书馆个性化服务中的适用性。一是在准确性上,相对于购物网站用户,高校校图书馆用户整体来说更加易区分,因此釆用基于用户的协同过滤算法,可有效提升高校图书馆个性化推荐的准确性。二是在高效性方面,高效性主要体现在物品相似度计算与用户相似度计算效率方面,当用户数量远远大于物品数量时,与用户相似度计算相比,物品的相似度计算消耗资源更小,因此基于物品的协同过滤效率更高效果更好;若物品数量远远大于用户数量,那么基于用户的协同过滤计算效率更高,效果更好。而在高校图书馆中,物品指的是文献,显然文献数量要远远比用户数量高,因此釆用基于用户协同过滤算法取得的效果更佳。三是在稳定性方面,主要取决于用户集合与物品集合哪一个更稳定,若用户集合稳定,则选择基于用户的过滤推荐算法,反之,选择基于物品的过滤算法,而在高校图书馆中,用户与物品每到新的学年便会更新,因此上述两种算法各有优势。
4 总结
综上所述,在信息时代下,高校图书馆在为用户提供个性化推荐服务过程中,应充分认识到大数据挖掘技术在其中运用的必要性,并立足于大数据各个环节,做好挖掘技术分析,通过建立一个完整的、数据挖掘技术在高校图书馆个性化服务推荐中的应用实现方案,促使大数据技术作用价值得以充分发挥,推动高校图书馆建设实现更好的发展。
参考文献:
[1] 郭淑红,徐玉梅,刘钊.基于数据挖掘的高校图书馆个性化图书推荐服务研究[J].电子世界,2017(4):44-45.
[2] 柳益君,何胜,冯新翎,等.大数据挖掘在高校图书馆个性化服务中应用研究[J].图书馆工作与研究,2017,1(5):23-29.
[3] 周婕,章增安,刘海涛.基于大数据的高校图书馆个性化推荐书目生成研究[J].晋图学刊,2017(5):29-33.
[通联编辑:章雅琪]
转载注明来源:https://www.xzbu.com/8/view-15162627.htm