您好, 访客   登录/注册

图书馆数据挖掘模型初探

来源:用户上传      作者:

  摘要:大数据技术是建立在现代基础算法之上产生的新型应用技术,大数据应用范围广泛,尤其是在图书检索领域,当前图书馆生态逐步形成,本文通过对图书馆数据挖掘模型的研究,揭示图书馆大数据技术的应用途径与方向。
  关键词:大数据;数据挖掘;数据模型
  中图分类号:G250 文献标识码:A 文章编号:1007-9416(2020)03-0089-02
  0 引言
  大数据、云存储、5G网络信号基站的建设,读者通过手机获得的图书资源数据远超过小型图书馆的图书总和,大数据裹挟着巨量的信息涌入到读者的阅读设备中,无纸化阅读变得越来越轻松。如何将图书馆中的“立体式”资源变成“数字化”资源,目前来说是图书馆发展的新课题。
  1 图书馆大数据架构与发展特征
  大数据技术是建立在现代基础算法之上产生的新型应用技术,大数据应用范围广泛,尤其是在图书检索领域,当前,以大数据为核心的图书馆生态逐步形成,首先,图书馆在业务运行中的内部管理数据,其次,图书馆的用户行为数据;第三,图书馆在知识服务中,挖掘和产生各类主题知识信息,为知识服务和技术发展提供大数据。
  图书馆大数据的应用特征:以基础数据为中心,以发展大数据为主要目标,挖掘图书馆的馆藏资源,为读者打造全方位、全资源的服务需求。同时图书馆的资源转换也从普通的存储模式转变为应用模式,数据存储到数据应用,已成为图书馆数据大数据发展的关键与核心。
  1.1 图书馆在业务运行中的内部管理数据
  图书馆运行过程中,主要是对文献信息的采集、加工、编目、提供、管理、收藏。在所有的业务环节中都会产生业务管理数据。例如:图书出版数据,图书发行数据,图书馆采购数据,图书馆编目加工数据,不同学科类目数据,图书馆图书的流通率等,对于图书馆管理,对于图书馆的上游机构,图书出版发行都将提供数据依据。
  1.2 图书馆的用户行为数据
  图书馆在的用户服务中会产生大量的用户行为数据,包括用户分类、用户的职业、用户的查阅、检索、复制、外借行为等数据,可以掌握用户多方面数据,并进行关联,通过用户行为数据分析,深入了解用户行为特点,用户需求内容,更好的为知识组织和生产环节提供专业信息检索和技术咨询服务。
  1.3 图书馆的文献知识数据
  图书馆在为用户提供文献检索时,对文献信息进行了编目分类标引,并提供知识组织的专题服务。根据用户需求,经过知识组织的文献信息,可全面揭示某一主题的数据和信息,可为不同的用户提供主题知识服务。经过积累和整合的的多学科知识组织信息和书目信息,可以为更多的用户提供服务。
  2 平台聚合数据挖掘的创新模式探讨
  目前图书馆在大数据挖掘和服务中,做了以下探索。首先以读者借阅信息为基础,依托互联网基础运算模型,为借阅图书的人员主动进行资源整合,目前形成了搜索与推荐互相结合的发展模式。
  2.1以CNKI为领衔的商业大数据平台服务模式
  目前图书馆参考的商业模式,主要是参照中国知网CNKI(China National Knowledge Infrastructure)等数据服务商推出的知识服务平台,如何依托大数据技术有效利用图书馆的图书资源为图书馆以后的发展道路提出了挑战。CNKI等各类商业数据服务平台,提供大量知识数据和读者读书的基础信息,基于以上信息,经过大数据整合,才能为读者推荐更个性化的图书内容。
  CNKI中国知网由于长期的数据积累,形成了文献信息大数据库,在大数据库的基础上,为不同的用户提供主题性知识信息服务,取得了较好的社会效益和经济效益。
  2.2 图书馆以微信为领衔的社交平台大数据分析模式
  大数据技术的基础是算法资源,载体是社交网络,信息的传播需要依靠某些技术手段,以微信、微博为平台,拓展信息化传播途径。除此之外,对于读者信息的采集方面要注重读者隐私,维护读者信息安全,将读者借阅的读书资源精细记录,将这份记录存储到本地数据库中,为以后图书馆会更好的服务打下基础。
  近几年不同类型的图书馆,启动微信公众服务平台,为用户提供更多的文献信息服务。国家图书馆,省市图书馆,高校图书馆等在微信公众平台上,发布资源信息和服务信息,提高了图书馆数字资源的传播和利用效率,也方便了广大用户。
  2.3 图书馆用户利用信息数据整合平台
  图书馆拥有用户利用文献信息数据,对用户利用文献信息数据进行采集,分析,追踪,可以通过用户利用的大数据,进一步分析研究用户对文献信息的需求方向、内容、数量,以及相关联信息的利用情况。可以为文献生命周期的发展提供大数据支撑。例如:可以采集文献的出版发行,图书馆文献机构的采购,用户文献的利用率等多方面的数据,为不同的用户提供数据。
  3 图书馆数据挖掘典型模型构建
  图书馆数据挖掘其实是将图书馆的馆藏资源整合之后,再进行细致划分,读者根据划分出来的分类,选择相关专业书籍,同时借阅的数据反馈给数据后台进行分析,更好的把握每一位读者的喜好和需求,为他们提供准确的知识服务。
  图书馆模型的构建不是简单的垂直模型,它可以分为很多种类,每一本图书都会和其它知识相互关联,就像大树的枝杈,每一科的知识又可以进行交叉。还有互动模型、图书借阅信用归还模型等。
  3.1 图书馆知识体系的交叉模型
  算法是大数据的基础,也是大数据的核心,基于统计数据给出最佳合理的安排,为读者提供更好的服务,可以借鉴维基百科的知识检索方式,将引用的资料列出链接,形成知识与知识之间的交叉模型体系的构建。
  3.2 图书馆图书资源的匹配模型
  在進行匹配模型之前,首先要有借阅者的读书数据,这期间需要考虑到两种因素,一是借阅者的身份基础信息,二是借阅者平时最多阅读的知识区域,把握这两个因素可以精确的给读者提供更好的服务、提供更精准的信息。   3.3 圖书馆的信用模型体系构建
  资源的数字化对图书馆的发展来说好处非常多,但是纸质化的资源更能给培养读者清晰的思维逻辑,在借阅读书时,通过大数据的基础算法,针对图书不归还的现象建立信用模型,详细的记录借阅者的借阅用途,归还时间等,保护馆藏资源,惩治失信人员。同时还可以按照按照读者信用提供优惠性服务,如免押金、滞纳金、提升服务优先级。
  3.4 图书馆读者借阅动态追踪模型
  在没有引进大数据技术之前,图书馆的借阅过程非常传统,也不容易搜集到图书信息,很少能从借阅单中挖掘出更多有价值的信息。但随着数字化的发展,就可以把借阅单变成基础数据,通过读者自主学习对图书馆知识服务数据进行调整。依据读者特征进行差别化知识服务,当读者想要研究别的知识领域时,系统就可以通过这些基层数据为读者提供更为精确的知识体系书籍,帮助读者更好的深入研究。
  3.5 图书馆信息聚合分类模型
  方便和效率;数据阅读集成一体,个性话定制知识服务界面使信息获取更加方便,对信息进行聚合分类大大提升阅读效率。阅读效率的提升一方面除了有科技的辅助作用外;另一方面也要能够适时地激发读者的阅读兴趣。大数据技术的应用就是根据每个人的阅读状态、兴趣等多方面为读者提供更为精确的读书内容、更优质的学习内容。聚合模型自己要进行定期更新,根据读者数量的增减重新进行模型计算分析,为读者提供新的阅读建议,最终打造成全平台数字资源共享供图书馆行业使用。
  4 结语
  图书馆大数据将彻底改变图书馆的发展脉络,重塑下一代图书馆的生态环境,也对图书馆事业的发展提出了新的挑战。
  参考文献
  [1] 马宏斌,王柯,马团学.大数据时代的空间数据挖掘综述[J].测绘与空间地理信息,2014(07):19-22.
  [2] 王菲菲,李晶.基于数据挖掘的电子商务动态定价模型[J].中国信息界,2012(11):179.
  Abstract:Big data technology is a new type of application technology based on modern basic algorithms. Big data has a wide range of applications, especially in the field of book retrieval, and the current library ecology is gradually taking shape. Through the study of library data mining models in this paper, Reveal the application path and direction of library big data technology.
  Key words:big data; data mining; data model
转载注明来源:https://www.xzbu.com/8/view-15232935.htm