基于兴趣点的多维度推荐算法研究
来源:用户上传
作者:
摘要:随着移动互联网技术的迅猛发展,人们更喜欢通过手机等移动设备在社交产品上分享自己的行为足迹或者对商品服务的评价。大多数的互联网产品利用用户的用户的兴趣点等行为信息为依据为用户推荐下一个潜在偏好的兴趣点。本文显示介绍典型的兴趣点推荐算法以及相关优缺点。针对这些算法考虑单一属性的问题分析基于兴趣点的多维度推荐研究。
关键词:兴趣点;多维度推荐;社交网络;用户偏好;个性化推荐
中图分类号:TP393
文献标识码:A
文章编号:1009-3044(2020)04-0171-02
收稿日期:2019-10-15
Research on Multi-dimensional Recommendation Algorithm Based on Interest Points
TIAN Chun-bo
(School of Computer Science,Southwest Petroleum University,Chengdu 610500,Sichuan)
Abstract:with the rapid development of mobile Internet technology,people prefer to share their behavior footprints or evaluation of goods and services on social products through mobile devices such as mobile phones.Most Internet products use users' behavior information such as interest points to recommend the next potential interest point for users.This paper shows the typical algorithm of interest point recommendation and its advantages and disadvantages.In view of these algorithms considering a single attribute,this paper analyzes multi-dimensional recommendation research Based on interest points.
Key words:interest points;multi-dimensional recommendation;social network;user preferences;personalized recommendation
随着人民生活水平和物质文化的提高,人们的兴趣点(如餐厅、购物中心娱乐广场等)更加丰富。在此背景下,基于地理位置的社交网络成为研究的重点内容,并广泛应用于互联网产品中,比如饿了吗、美团、Twitter等。
用户-兴趣点的关联在实际商业应用有着特殊的指导意义。既可以通过推荐及时告知用户偏好的兴趣点,又可以通过用户共同兴趣点加强彼此的联系。也能辅助兴趣点改进自己的营业策略,吸引用户,实现二者的双赢[1]。
1 典型兴趣点推荐算法
1.1 基于协同过滤的推荐
基于协同过滤的推荐方法是通过关注类似用户的行为[2],进而发现用户潜在的偏好。即通过评分数据,在計算出的详细邻居集合中寻找用户潜在偏好。算法过程:
(1)创建用户-兴趣点评分矩阵
兴趣点pj在用户-兴趣点的评分,表示发现用户对兴趣的概率,来预测用户在未访问过的兴趣点处签到或访问的可能性。计算公式:
(2)相似度计算
相似度计算求最近邻集合。根据相似度找出相似的用户相似度计算方式有距离计算和向量计算等。对于Ri(ri1,ri2,…,rin)和Rij(rj1,rj2,…,rjn)两个向量表示用户对n个不同兴趣点的评分,则相似度计算公式:
皮尔森相似度:
余弦相似度:
欧式距离:
SRC相似度:
该推荐算法会随着用户签到行为数据增多,准确度会得到明显提升,但是,这种方法只考虑到用户的历史行为,而不考虑用户自身的内容和属性,对于复杂的非结构化对象,比如视频、音乐、图片等特征抽取相对来说是比较困难的;而且基于协同过滤的推荐算法天然存在着冷启动和矩阵稀疏的问题[3]。
1.2 基于内容推荐算法
基于内容的推荐算法是最早应用的推荐算法。它的基本原理[4]是将用户的兴趣偏好通过挖掘内容(提取关键词的方式)变成一系列标签;然后计算每个用户的兴趣标签与每个兴趣点的相似度,为用户推荐相似度高的新的兴趣点。
基于内容的兴趣点推荐需要使用自然语言技术提取内容特征的关键词[5],并且根据关键词向量计算权重;这里使用TF-IDF算法,TF代表词频,IDE代表逆向文频率。计算权重公式:
计算相似度。使用上述介绍的相似度计算方法计算关键词的相似度。
基于内容的推荐算法的优势在于[6]算法很好的稳定性,结果易解释,能够产生比较新的推荐。但是该算法比较以来大量的文本内容,并且对文本中的内容特征需要良好的结构性;其次对于很多场景下比如多媒体内容的无法进行特征提取;
2 多维度联合推荐
多维度联合推荐[7](Multi-dimmensional Koint Recommendation Algorithm,MJRA)针对上述算法片面考虑单一或某些维度而提出的一种融合空间、时间流行度、类别和社会维度的多维度个性化推荐。 算法步骤如下:
1)将用户签到数据按照位置进行过滤,减少噪音;
2)对提取的用户-兴趣点矩阵进行矩阵分解并引入时间衰减函数,体现用户偏好关于时间的变化趋势。时间衰减函数:
基于流行度推荐。兴趣点的流行程度代表了兴趣点的受欢迎程度8,选取兴趣点v的总访客量v(0)和兴趣点t的总签到.数t(o)作为流行度特征。公式:
综合时间和流行度维度,得出预测用户兴趣点的主观评价;主观评价公式:
3)构建类别社交网络矩阵。使用PageRank算法计算好友关于不同领域的权威程度,将结果引入基于社交网络的协同过滤算法,预测用于关于兴趣点的客观评价。客观公式:
4)对得出的客观和主管评分采用线性组合的方式进行融合,最终使用Top-N推荐评分最高的给用户。
在测试中作者提出的算法实验结果与协同过滤、LFBCA和USG,准确率提高15%,召回率提高10%,提升效率显著。
3 总结
本文主要介绍基于LBSN的概念以及相关的算法技术,但是它们都存在着各种各样的缺点。最后考虑到为了提升推荐准确率的问题,需要考虑其他数据维度的因素,例如上下文信息、长期与短期兴趣等,需要以后重点研究。
参考文献:
[1]王石岩.面向LBSN的多维度因素融合兴趣点推荐机制研究[D].上海:华东师范大学,2017.
[2]汤文哲.基于深度学习的个性化推荐系统研究[D].福州:福州大学,2017.
[3]马宏伟,张光卫,李鹏.协同过滤推荐算法综述[D].小型微型计算机系统,2009,30(7):1282-1288.
[4]王亮.基于主题模型的文本挖掘的研究[D].大连:大连理工大学,2015.
[5]李昆仑,万品哲,张德智.基于改进用户相似性度量和評分预测的协同过滤推荐算法[J].小型微型计算机系统,2018,39(3):567-571.
[6]刘袁柳.面向LBSN的兴趣点和用户推荐方法研究[D].苏州:苏州大学,2015.
[7]韩笑峰.LBSN中的多维度兴趣点推荐[D].太原:太原理工大学,2018.
[8]宋文君,郭强,刘建国.一种改进的混合推荐算法[0]上海理工大学学报,2015,37(4):327-331.
[通联编辑:唐一东]
转载注明来源:https://www.xzbu.com/8/view-15162133.htm