一种融合了基于朴素贝叶斯算法与情境感知的协同推荐系统
来源:用户上传
作者:
摘要:[目的/意义]将情境感知技术引入图书馆以提高服务的智能化,已成为数字图书馆的发展趋势之一。为了提高情境感知模型中推荐结果的准确度。[方法/过程]本文研究并提出了一种融合了朴素贝叶斯算法与情景感知功能的协同推荐模型,并通过实验对推荐效果进行了评估。具体为:首先,获取用户的当前任务和情景信息,同时提取历史信息库用户的行为偏好;其次基于属性加权贝叶斯算法计算用户的行为相似度,继而进行协同推荐;通过计算目标情景中所有情景属性对所推荐资源的影响的权值,对协同推荐所得评分进行加权处理,形成最终的预测预测;最后通过实验对模型进行检验。[结果/结论]结果表明:使用该模型得出的推荐结果优于传统的协同推荐结果。因此该模型能够更好地为为个性化信息服务提供支持。
关键词:情景感知;朴素贝叶斯;协同推荐;图书馆
DOI:10.3969/j.issn.1008-0821.2019.02.007
〔中图分类号〕TP391〔文献标识码〕A〔文章编号〕1008-0821(2019)03-0057-09
随着互联网技术的日益发展,知识库中的信息量呈指数增长,用户的专业性知识需求随之增加,简单的非语义化搜索引擎已经很难捕捉、定位到用户真实需求。作为知识存储、组织与利用重要机构的图书馆,其自身拥有的个性化服务虽能在表面上满足大多数用户需求,但在深层需求挖掘与感知上,仍然表现出诸多不足,具体表现为:1)情境适用性差。虽然查询系统十分方便,但仍不能获取用户潜在需求;2)推荐结果不够精确。即使能通过网络信息显式获取用户需求,但可用性和可靠性仍不理想;3)资源匹配自适应性低。当用户的信息需求不具有很强目的性,或无法准确被描述时,系统很难根据画像推出用户可能感兴趣的信息。
针对以上问题,基于情境感知技术的推荐系统能够很好地解决图书馆目前面临的困境。个性化推荐能够针对用户的兴趣点进行推荐,可以更好地满足用户的需求。情境感知技术具有探测用户潜在需求与感知性描述用户情境的功能,从而使得具有这种功能的推荐系统能够有效感知处于不同位置、不同时间和不同状态下的用户需求[1]。两者相结合的新型推荐系统将是一个解决数字图书馆目前面临问题的有效方案。
本文将利用基于属性加权的朴素贝叶斯算法的情景化用户资源类别偏好学习以及融合该类别偏好的协同过滤个性化信息推荐,通过加入情境感知算法,即对不同影响力的情境因素赋予权重来提高传统协同过滤算法的准确度,从而为读者在不同情景因素下提供更加准确地推荐服务。
1相关研究
情景,是指用来描述实体情形和特征的任何信息[2],利用情景向用户提供相关信息服务的过程就是情境感知服务[3]。引入情景和情景感知能使推荐系统能够具有“个性化”和“普适计算”的优势,进一步提高个性化服务的精准度和用户满意度[4],这引起了学者的普遍关注。Kim J等将情境感知与个性化推荐用个性化健康服务系统中,他们将提出的情境感知模型应用于协同过滤过程中的用户偏好缺失值提取上,实现了协同过滤与情境感知的结合[5]。Kown O等创建的NAMA原型系统通过用户情境、用户描述等信息来发现用户的信息需求,从而为电子商务购买者提供个性化信息[6]。Mylonas P等分析了用户的历史情景和当前情景的表示,并对不确定环境下的模糊情景(如用户注意力和愿望等)展开了研究,认为情景是提升个性化信息服务质量的有效手段[7]。李晟建立用户观影的情景模型,将用户观影情境因素应用到现有的推荐系统中,提升电影推荐的用户满意度[8]。
对于图书馆来说,情景感知作为普适计算的核心技术之一,能够利用传感器使软件根据使用地点、服务器、相关用户、周边设备等变化而调整自身状态,以达到支持用户随时随地获取符合个性化需求的信息的目的[9]。Lee提出通过提供图书状态信息、内容信息、电子书是否可借阅等实现情感感知在图书馆中的应用[10]。Aittola M等提出将情境感知与导航系统相结合,从而读者在图书馆中可通过手持PDA设备获取位置感知服务,根据有关书籍的地圖向导迅速找到所需图书等[11]。
对于图书馆的使用者来说,图书馆最主要的用途是为其提供所需要查阅或浏览的书籍。当用户无法明确描述自己的需求时,就需要系统为其提供合适的内容推送。结合情景感知的推荐系统相较于传统推荐系统能够更加动态、主动地察觉用户的潜在需求,从而为用户推荐恰当、符合当前场景的内容,如何将情境感知与图书馆个性化服务结合起来。张剑等集成情景感知的图书馆服务体系框架,将图书馆的管理及信息服务与情境感知技术相结合,通过用户的信息和定位为用户提供服务[12]。黄传慧将情境感知理论应用于图书馆学术信息推荐系统,并提出基于情境感知—目标用户—资源协同驱动推荐模型,采用隐式获取用户情景偏好信息的方式,结合协同过滤为学术用户提供科研方面的推荐[13]。洪亮等基于移动数字图书馆的特性,提出了一种WSSQ算法构建用户信任网络,由此给出改进的情境感知推荐方法,并将情景作为参数纳入用户信任度、相似度的计算中,以体现情景对用户选择的影响[14]。
综上所述,图书馆作为一个知识信息中心,必须要适应新技术的变化,将情景因素考虑到个性化推荐中,才能满足用户的不同需求。目前的情境感知推荐系统中,存在的主要问题有构建的模型无法用于现实、推荐内容与用户实际需求匹配度较低等问题。一方面是因为提出的模型太过于理想化,偏向于静态、稳定的环境,而现实图书馆的推荐系统需要面对的是一个动态、变化的环境;另一方面则是没有考虑到在一个情景中不同的情景属性对用户选择影响是不同的。基于此,本文提出对判断在某一场景下用户选择某类资源的概率的朴素贝叶斯算法进行属性加权的想法,通过计算特定场景中不同情景属性对用户选择该类资源影响程度的大小,使得朴素贝叶斯算法的概率计算更加精确,从而适应在动态的环境中的推荐。
2图书馆情景感知自适应个性化服务的应用模式 在传统的信息交流体系中,图书馆是传播科学知识和提供知识服务的重要角色。但随着数字资源和信息技术的发展,用户获取和使用信息的方式也相应发生了变化,图书馆若要避免自己信息服务中心的地位发生变化,就必须寻找并精确地满足用户变化的信息需求。因此,如何将基于情景的推荐系统与图书馆个性化服务结合,实现图书馆信息服务的可持续发展,受到了许多学者的关注。
现有图书馆的个性化推荐主要考虑用户和资源或用户和服务两个方面的因素,而基于情景感知的个性化推荐在尝试通过用户的需求和服务情景生成精准度更高的推荐,由于科技水平等方面的限制,还无法完全智能化的捕获情景信息,实现全面、准确的推荐还存在困难。Mighali V等提出的“物联网—情境感知服务模型”,通过可捕捉和处理用户观察内容的穿戴设备,将用户的情景信息发送至可与设备交互的处理中心[15]。张帅等提出的“基于情境感知的高校移动图书馆个性化推荐模型”,采用向量空间模型表示方法和智能信息处理技术,并通过对环境变化和已有情景信息的挖掘实现对用户个性化信息推荐服务[16]。周玲元等提出了一种“智慧图书馆”情境感知服务模式,通过情景感知技术构建“智慧图书馆服务平台”,实现图书馆实体与线上移动设备融合的个性化服务[17]。因此,如何将情景信息,尤其时间信息,融入多维关系模型,是我们在构建模型时重点讨论的问题。
在我们的推荐系统中,用户直接接触和接受反馈的是图书馆在每个楼层中提供的图书查询机。查询机中的系统完成的两个主要任务:通过定位和系统自带程序收集用户此时的情景信息及需求信息,其中位置信息由查询机中的定位系统采集,时间信息由系统的时间系统获取,需求信息(包括阅读目的和类别)由用户输入的内容和查询时类别选项的勾选进行判断。将结果发送至推荐系统,然后由负责分析情景加权和协同推荐的功能完成搜索结果的推荐并将结果反馈给查询机的系统终端。
由图1可知,“数字图书馆服务推荐模型”的基本服务过程可划分为图书馆服务平台、情景数据获取层、情景数据分析层和智能推荐层4个模块。读者通过数字图书馆系统终端进入并使用图书馆时,推荐系统的数据采集层将会自动获取用户的当前任务和情景信息,如用户的位置、使用时间、阅读目的和目标图书类别,并将所获得的数据进行处理,以便根据用户历史信息库中存储的用户偏好和情景信息和用户浏览或检索的关键词,合并生成相应的情景信息模型。在情景数据分析层,数字图书馆平台根据其他读者在相同情境下对资源的需求,计算出基于协同过滤的用户相似度,找到与目标读者相似的邻居读者,向目标读者生成推荐信息候选集。最后,智能推荐层通过计算该情景中所有情景属性对所推荐资源的影响的权值,综合得到用户此时的情景化信息需求,生成最优的个性化推荐信息列表推送给用户。用户根据推荐结果进行浏览并反馈,数字图书馆系统将用户反馈和获取到的当前情景信息录入用户历史信息库,将系统推荐给读者的資源录入情景信息库和基本信息库,为以后系统进行相同推荐提供数据和便利。
3基于属性加权朴素贝叶斯算法的个性化图书馆服务推荐模型
传统的情景感知信息推荐模型是基于“所有的情景属性对于信息推荐所起的作用是相同的”这一背景所进行推荐,即这些推荐方法假定在任何情境下,不同情景因素对信息影响的权重值相同[18],属于静态、封闭环境中的推荐方法。在实际生活中,读者对相同的情境信息中的不同情景因素通常有不同的偏好,有些情景因素比其他情景更能改变用户的最终选择。有学者将同一读者对于不同情境发生变化的感知能力的不同称之为“情境感知度”[19],即有些情景只是发生细微的变化,读者对同一资源的兴趣程度就会发生明显的改变;而有些情境虽然发生较大的变化,但读者对该资源的
图1图书馆情景感知个性化服务的应用模式
兴趣程度仍然保持不变。按照这一理念,我们将读者对不同情境的不同感受定义为“情境感受性”,它反映了情景变化对读者兴趣变化的影响程度。例如,对于推荐的娱乐类书籍,在“时间”情景因素下,用户可能更倾向于在周末的非工作时间的情景属性中选择娱乐类书籍;而在“完成论文”这个情景属性下,用户更可能在工作时间选择科研类的书籍,以此获得更多有用的信息。为了确定不同环境因素对信息推荐所产生的不同影响,本文提出了“基于属性加权朴素贝叶斯算法的协同推荐模型”来度量用户的情境感知性。由于环境中情境属性之间彼此的相关性较小,即用户查阅时间的不同并不会影响用户所在楼层这一情景属性,而朴素贝叶斯算法对属性相关性较小的数据有着较好的分类效率和质量。因此相较于其他分类算法,属性加权朴素贝叶斯算法更适用于对协同推荐进行情景加权处理,在动态、开放的环境下对用户进行推荐。
3.2当前情境下读者相似度计算
推荐系统可采用的推荐方法有:基于内容过滤,协同过滤以及混合推荐,我们采用的是应用较为广泛,分类效果也相对较好的协同过滤来对用户进行初步推荐。相较于传统过滤推荐算法的用户、事件的二维关系,基于属性加权贝叶斯算法的协同过滤推荐是将其扩展为用户、事件、环境的三维关系,在算法中融入了情景信息。推荐步骤主要分为3步:第一步,根据“用户×资源”评分矩阵计算用户之间的相似度;第二步,根据用户间的相似度为当前用户寻找近邻,对其进行预测评分;第三步,结合属性加权的贝叶斯算法,计算出情境权重,继而实现推荐。
4实证
4.1实验数据获取
本文数据集来源于事先从华中师范大学数字图书馆的官方网站上,选取热门借阅提供的22个分类中的10个分类,分别用爬虫工具抓取30个左右的书籍名称,共计330个,人工将其分为哲学社科类(如马列主义等)、人文艺术类(如文学、艺术等)、工业技术类(如计算机技能等)和综合科学类(如数理科学等),以下简称为社哲类、人文类、工技类和科学类,每个分类下约有80个书籍名称,作为此次试验中受试者进行评分和情景选择的对象。 实验中考察的情境因素共有3个,分别为:时间(工作日,周末)、地点(图书馆1~9楼)、阅读目的(科研、扩展、休闲、技能等)。在实验中如果受试者对某类书籍的阅读情景的选择为组合A:(周末,图书馆5楼,休闲),那么当该受试者再次遇到情景组合A时,系统将会优先为他推荐该类书籍他更可能想要的书。
本实验共选取8名19~22岁的在校大学生作为测试者。实验分为训练集准备和推荐集测试两个部分。在训练集准备阶段,所进行的实验是通过发放调查问卷的方式为模型收集足够的情景信息和用户偏好;在推荐集测试阶段,在指定情境下通过协同推荐和朴素贝叶斯算法情境加权计算为受试者形成推荐书单,再让受试者对书单的内容进行打分,从而判断改良算法相较于传统算法的优劣性。
在准备阶段,笔者为每个测试者提供了1份包含50个书籍名的书单,书籍名均从以上4类中隨机抽取,为保证数据集的可靠性和真实性,每份书单中的书籍名都有一定的重复率,测试者需对其进行阅读情境的选择和情感偏好的评分,其中情感偏好的评分范围为1~5,从低到高分别表示非常不喜欢、不喜欢、无所谓、喜欢、非常喜欢。例如,受试者在对《百年孤独》进行场景选择时,时间上更倾向于选择周末,地点一般是在2楼,阅读目的一般为休闲,比较喜欢阅读《百年孤独》类小说但更喜欢同书单的《白夜行》,所以打分为4分。将所有问卷回收后,根据分类标准将所得数据进行整理后,所得数据如表1所示。
4.2数据处理与分析
4.2.1情景因素权值获取
由于每份书单中都有一定的重复率,且不同受试者对同一本书的情景属性选择不同,因此我们将其看做两条不同的数据进行统计,一共得到400条数据,除去不确定的数据条后所得有效数据为378项。将收集到的数据按照不同类别和不同属性的交叉对应关系进行数量统计,分别计算每个属性值在不同类别下所占比例,再计算不同类别在同一属性值下出现的概率,将所得数据进行归一化处理后,可得到单项情景因素属性对不同类别的影响权重。例如,在人文类书籍中,选择工作日查阅的书籍共有13本,选择在周末查阅的书籍共有80本,经过统计所得工作日对人文类书籍影响权重为0.138,而周末对人文类书籍的影响权重为0.862,这说明受试者在阅读人文类书籍时更习惯于在周末进行。
此处为避免权值为0,我们将所有的权重进行加1处理,所得结果如表2所示:
4.2.2协同过滤推荐与属性加权
在推荐集测试阶段,我们首先让受试者选择一个情景M,系统将生成一组符合用户所选情景的推荐A和一组以传统协同过滤算法生成的推荐B供受试者选择,受试者根据情景M和自身的阅读习惯对所提供书单中的书籍一一进行推荐准确度的打分,重复进行多次不同情景的实验,最后通过计算A、B两组书单中书籍的最终得分,比较两种算法的优劣性。
在生成推荐列表A时,由于情景此时已经确定,不属于此情景的数据对推荐无任何用途,反而会成为干扰项对最终的推荐造成偏差,所以为减少运算花费的时间,我们尝试将与所选情景中属性值均不相同的数据行置为零,事实证明该操作是可行的。构建用户×物品的二维矩阵并将用户的评分填入关系矩阵中,然后根据皮尔逊相关系数计算用户之间的相似度形成用户评分相似矩阵:
因为用户×物品矩阵较为稀疏,所以我们选择相关系数较高的前两位用户作为相似用户组建近邻矩阵,按照最后评分高低得到排名前15的推荐列表。前面实验步骤所得的情景权值已知,根据情境M的属性值,将用户的推荐结果进行加权处理后重新排名,选取排名前10的结果形成最终的推荐列表。例如此处我们为用户B设定的情景M为{工作日,5楼,科研},在传统算法中《演讲的艺术》排名非常靠前,这是因为用户B和他的相似用户群体对这类书籍的兴趣较高。但在改良方法中,《演讲的艺术》排名较低,并不在前五的行列中,这是因为《演讲的艺术》属于人文类书籍,在情景M中它的情景因素属性加权值较低,因此最后的综合得分较低。经过整理后部分结果如表3所示:
表3本文方法与传统方法推荐结果对比(部分)
用户A用户B改良方法传统方法改良方法传统方法
1《马克思民主观的文本研究》《马克思民主观的文本研究》《管理心理学》《演讲的艺术》
2《列宁论科学社会主义》《元代理学伦理思想研究》《社会心理学》《平凡的世界》
3《社会契约论》《社会心理学》《社会研究方法实用教程》《爱情心理学》
4《元代理学伦理思想研究》《列宁论科学社会主义》《老年社会学》《精读鲁迅》
5《老年社会学》《SQL Server范例开发大全》《爱情心理学》《管理心理学》
4.2.3推荐效果评价
基于情景感知的个性化推荐是为帮助用户更准确的找到所需要的资源,而广泛采用的平均绝对偏差MAE(Mean Absolute Error)反映的是实际预测误差的大小,无法判断用户对推荐资源的满意程度。本文实验中借鉴了前人的评价方法[21],即用读者接受度(Reader Acceptance Radio,RAR)来判断推荐的优劣,计算公式如下:
RAR=∑RInterest{I.1,I.2,…,I.N}∩(Top-N Book)(Top-N Book)(9)
其中∑RInterest{I.1,I.2,…,I.N}表示目标读者感兴趣的文献资源,{Top-N Book}表示在该列表中读者对资源的采纳程度。则RAR的值越高,该推荐方法在当前情景下给读者推荐的资源越合适。
在对推荐效果进行评价时,推荐系统算法根据指定情景M生成两组推荐推荐书籍,其中一组是符合用户所选情景的推荐书单A,一组是以传统协同过滤算法生成的推荐书单B,受试者根据设定的情境M分别对推荐书单A、B中的项目进行反馈,如情景M为{周末,7楼,技能},对推荐书单中的书籍《博弈论导论》,受试者根据个人喜好和阅读目的对推荐书籍与目标书籍的相似度进行评价,即在满分10下对书籍的满意度进行打分。设定评分大于等于5的书籍为读者采纳资源{Top-N Book},评分大于等于8的书籍为读者感兴趣的资源∑RInterest{I.1,I.2,…,I.N},最后统计书单A和书单B中符合要求的书籍的个数,计算读者接受度(RAR)。为保证实验的准确性,笔者为每个用户提供多个情景,对不同的情境系统推荐的资源不同,均需测试者提供反馈。根据提供的反馈进行推荐准确率的计算,从而衡量推荐的质量。将用户反馈的数据进行剔除和筛选后,计算传统协同过滤算法和改进的方法的读者接受度,对比结果如图2所示。因为每个测试者对应多种情境的推荐,此处的接受度为多种情况推荐的接受度的均值,最后一组的数据为前八组数据的均值。 图2两种协同过滤出信息推荐方法的比较
从图2中可以看出,A组数据的推准率普遍优于B组。说明在实际情况下,本文提出的算法相较传统协同过滤算法,有着较高的准确率和性能优越性。因为传统协同推荐算法在为用户进行推荐时,仅仅只是依靠之前的数据为用户提供他会感兴趣的内容,但凡场景发生些许变化,传统算法就很难再处理好高评分内容和实际需求内容之间的关系。而基于朴素贝叶斯加权的情境感知协同过滤推荐算法在传统算法的基础上融入了情景信息,由原来的用户×资源的二维关系变为用户×资源×情景的三维关系,从而通过对不同情景下的用户进行不同内容的推荐来满足用户个性化的需求,而非对任何情景都进行单一内容的推荐。实验结果也表明,基于朴素贝叶斯加权的情境感知协同过滤算法能够更好地识别不同情景对信息推荐的影响力大小,能够提供给读者更加精准的个性化推荐,提高推荐系统的质量、水平和准确性。
5结语
在移动互联网高速发展的背景下,图书館需要从被动满足读者需求变为主动感知用户情境并进行个性化服务推荐,简单的资源内容推送已经难以发挥馆藏的最大价值,也不能突出图书馆本身的特点和实现社会信息沟通的目的。引入情境感知技术以提高服务的智能化、人性化、个性化,已成为数字图书馆的发展趋势。本文从情境感知的角度,针对图书馆个性化服务推荐进行研究,并提出了基于朴素贝叶斯算法的属性加权情景信息结合传统协同过滤方法对图书馆的用户进行智能化推荐的算法,能够根据用户的时间、地点等信息,向用户推荐符合当前情景的信息。通过实验表明该算法相较于传统协同推荐算法有着更好的推荐效果和准确率。然而,本文虽然实验数据足够,但实验者数目较少,考虑的情景影响因素量也有待增加,同时实验中存在较多泛化因素,因此实验还有待于进一步提高。此外,下一步的研究方向可以是用户情境感知信息的有效获取和多维情景信息下对推荐的影响,以进一步证明该模型的有效性和推荐的准确性。
参考文献
[1]袁静.情景感知自适应:图书馆个性化服务新方向[J].图书情报工作,2012,56(7):79-82,97.
[2]Dey A K,Abowd G D,Salber D.A Conceptual Framework and a Toolkit for Supporting the Rapid Prototyping of Context-Aware Applications[J].Human-computer Interaction,2001,16(2-4):97-166.
[3]Dey A K.Understanding and Using Context Personal and Ubiquitous Computing Journal[J].Personal & Ubiquitous Computing,2001,5(1):4-7.
[4]郭高尚.情景感知的移动推荐研究[D].邯郸:河北工程大学,2014.
[5]Kim J,Lee D,Chung K Y.Item Recommendation Based on Context-aware Model for Personalized U-healthcare Service[J].Multimedia Tools & Applications,2014,71(2):855-872.
[6]Kwon O,Choi S,Park G.NAMA:A Context-aware Multi-agent Based Web Service Approach to Proactive Need Identification for Personalized Reminder Systems[J].Expert Systems with Applications,2005,29(1):17-32.
[7]Mylonas P,Vallet D,Castells P,et al.Personalized Information Retrieval Based on Context and Ontological Knowledge[J].Knowledge Engineering Review,2008,23(1):73-100.
[8]李晟.基于情境感知的个性化电影推荐[D].北京:北京邮电大学,2012.
[9]Schilit B,Adams N,Want R.Context-Aware Computing Applications[C]//The Workshop on Mobile Computing Systems & Applications,1994:85-90.
[10]Lee,The Concept of the Context-Aware Computing and Its Application to the Library Information Services.
[11]Aittola M,Ryhnen T,Ojala T.SmartLibrary-Location-Aware Mobile Library Service[M]//Human-Computer Interaction with Mobile Devices and Services.Springer Berlin Heidelberg,2003:411-416.
[12]张剑.移动时代高校图书馆的情境感知服务系统研究[J].新世纪图书馆,2012,(5):42-45,1.
[13]黄传慧.基于情境感知的图书馆学术信息推荐系统构建研究[J].图书馆工作与研究,2015,(10):21-26.
[14]洪亮,钱晨,樊星.移动数字图书馆资源的情境感知个性化推荐方法研究[J].现代图书情报技术,2016,(Z1):110-119.
[15]Mighali V,Fiore G D,Patrono L,et al.Innovative IoT-aware Services for a Smart Museum[C]//International Conference on World Wide Web.ACM,2015:547-550.
[16]张帅,郭顺利.基于情境感知的高校移动图书馆个性化推荐模型研究[J].情报探索,2014,(10):6-11.
[17]周玲元,闫思琪,朱翔宇.“智慧图书馆”情境感知服务模式及评价研究[J].图书馆学研究,2017,(21):23-30.
[18]Adomavicius G,Tuzhilin A.Context-aware Recommender Systems[C]//ACM Conference on Recommender Systems.ACM,2008:335-336.
[19]曾子明.移动环境下基于情境感知的数字图书馆个性化信息推荐研究[J].图书情报工作,2013,57(12):123-128.
[20]秦锋,任诗流,程泽凯,罗慧.基于属性加权的朴素贝叶斯分类算法[J].计算机工程与应用,2008,(6):107-109.
[21]曾子明,李鑫.移动环境下基于情境感知的个性化信息推荐[J].情报杂志,2012,31(8):166-170.
(责任编辑:郭沫含)
转载注明来源:https://www.xzbu.com/4/view-15168062.htm