个性化旅游推荐技术研究及发展综述
来源:用户上传
作者:
摘 要:该文首先分析了个性化旅游推荐系统的数据来源,并介绍了用户行为数据、用户标签数据、上下文信息和基于社交网络数据等推荐技术近年来的研究进展。其次,分析了能提升推荐性能的混合推荐技术以及满足多约束场景的基于约束的推荐技术,介绍了相关领域的最新研究成果。最后,展望了个性化旅游推荐技术研发的发展方向。
关键词:个性化旅游;推荐系统;协同过滤;混合推荐;标签数据;多约束场景
中图分类号:TP316 文献标识码:A 文章编号:2095-1302(2020)03-00-03
0 引 言
随着信息技术的迅猛发展,旅游行业与信息技术深度融合的需求越发强烈。在信息过载(Information Overload)的大数据时代,用户经常会感到无法快速获取自己所感兴趣的信息。因此,根据用户的偏好,向用户推荐其感兴趣的个性化旅游推荐技术孕育而生。
个性化旅游推荐技术就是将推荐系统融入旅游行业,通过个性化的推荐,可以向用户提供辅助决策,更高效、更精准地向用户推荐其感兴趣的旅游产品[1-2],因此,具有广阔的应用空间和研究价值。
1 推荐系统及相关技术
推荐系统(Recommender System)在分析用户行为数据的基础上,建立对应的兴趣模型(Interest Model),基于模型向用户推荐满足其兴趣的偏好信息。
推荐技术可以按数据来源进行分类,这些数据包括:用户行为数据、用户标签数据、上下文信息和社交网络数据等。近年来,为进一步提升推荐系统技术的性能、满足多约束场景下的应用,众多研究人员分别提出了混合推荐技术[2-6]和基于约束的推荐技术[7-9]。
2 利用用户行为数据的推荐技术
网站等平台在运行过程中会记录大量的日志(Log)数据,这些日志数据包含的用户行为数据,包括:页面浏览、购买、点击、评分和评论等。利用用户行为数据的推荐技术正是借助用户行为数据实现推荐的一种推荐技术,可分为基于邻域(Neighborhood-Based)的推荐技术、基于隐语义模型(Latent Factor Model)的推荐技术以及基于混合模型(Hybrid Model)的推荐技术等。
2.1 基于邻域的推荐技术
基于邻域推荐的核心是协同过滤(Collaborative Filtering,CF)。单纯的CF受限于其性能,较少应用于旅游推荐。
文献[10]为解决传统协同过滤中存在的数据稀疏性、冷启动等问题,提出了面向旅游产品推荐的基于不确定近邻(Uncertain Neighbors)的协同过滤算法(IUNCF)。IUNCF算法首先利用K-means聚类技术实现用户信息的动态分类筛选并分配推荐权重,然后结合内容信息,实现协同过滤推荐。实验结果显示,IUNCF算法能够更有效地实现旅游产品推荐,其推荐准确度也相应提升。
2.2 基于隐语义模型的推荐技术
基于隐语义模型的推荐技术由于性能良好,源自文本挖掘领域的、旨在抽取文字中隐含语义的模型成为主要的推荐技术之一。
文献[11]改进了经典Apriori算法,提出了融合矩阵聚类(Matrix Cluster)的MC-Apriori算法,同时,对用户行为进行频繁集挖掘,最终实现符合用户搜索偏好的推荐。通过分析实验结果,验证了MC-Apriori算法的准确性高于Apriori算法。
孙彦鹏等提出了基于多重隐语义的MLSTR-RM模型用以表达旅游路线[12]。借助MLSTR-RM模型提取上下文的隐语义数据,采用负采样方式将来自隐语义数据的训练集数据用于模型参数的训练,并设计个性化景点推荐算法。经过在真实数据集上的测试,验证了MLSTR-RM模型的有效性。
朱桂祥等提出面向旅游产品推荐的基于主题序列模式的SECT引擎[13]。SECT引擎首先挖掘日志的主题以发现用户行为范式,然后构建序列模式数据库。最后,用Markov N-gram模型完成点击流与序列模式数据库的匹配。经过真实旅游数据集的测试,SECT引擎较之传统算法,其性能更优越。针对冷启动用户,SECT引擎的推荐率和准确率也更高。
文献[1]以众源地理数据集合为对象,研发了面向热门路线推荐的路线可视化平台。其技术路线是,首先,借助标签化技术实现路线数据的剪枝和筛选;然后,以Apriori算法挖掘数据集中的频繁景点序列;其次,利用协同过滤寻找相似度高的路线;最后,根据频繁序列项的综合收益进行推荐排序。实验数据显示,该平台能提升F-Measure、召回率和准确率等性能指标。
2.3 基于混合模型的推荐技术
混合模型即采用两种及以上的模型来设计推荐算法,由于其性能优良,近年来已成为研究热点。
文献[3]利用在线评论数据设计出一种景点个性化推荐算法。该算法通过对用户景点评论进行情感偏好分析,并运用领域本体构建技术,计算用户的需求和满意度,结合群体智慧,向用户推荐符合其偏好的个性化旅游策略。
针对标记数据不足影响推荐效果的问题,文献[4]提出一种基于域适应的个性化景点推荐算法。该算法使用域适应技术,并将标记数据设置为辅助数据,运用训练数据来训练推荐模型。实验结果表明,该算法能较好地解决标记数据不足的问题。
陈君同等提出一种协同过滤与用户偏好相融合的旅游组推荐算法[5]。该算法将相似性影响和关联性两种因子加入到协同过滤中用以评分预测,结合均值和最小痛苦两种策略提出综合组内局部和整体两种满意度的满意度平衡策略。从实验结果来看,該算法能提升推荐的准确率。
文献[2]提出一种基于混合推荐策略的旅游推荐系统。首先,建立基于用户静态和动态两种信息的混合用户兴趣模型,模型包含短期兴趣和长期兴趣两种模型;然后,设计启发式旅游行程规划算法,该算法是基于多维度景点评分的;最后,通过实验验证了旅游行程规划算法的有效性,并在服务器端和iOS端部署了系统。 Fenza等改进了协同过滤,并提出一种上下文感知推荐算法[6]。该算法利用游客和景点构建模糊分类器,通过分类器对新游客进行分类,然后利用上下文信息对比用户感兴趣的景点并生成类别匹配结果,最终对同一类别中的景点进行推荐排序。
3 利用用户标签数据的推荐技术
借助物品和用户的特征(Feature)或标签实现推荐也是重要的推荐技术,常见的标签是普通用户赋予物品和用户的,称为用户生成的内容(User Generated Content,UGC)标签。
文献[14]将深度学习(Deep Learning)技术应用于旅游服务推荐系统。首先,在预处理阶段,利用词嵌入法对评论等数据进行处理,以实现词汇的低维和稠密表示,同时,词汇中还融入了语义;其次,采用CNN网络和DNN网络对用户在线评论信息进行处理并提取其特征;再次,采用因子分解机技术构建共同作用层来连接三个网络,以提升特征的提取精度,降低数据稀疏的影响;最后,通过实验结果证实,提出的旅游服务推荐系统比传统推荐技术更为有效。
基于深度挖掘出的用户画像(Users'Demographic)是抽象的标签化画像,能有效反映用户行为特征。因此,用户画像已成为提升推荐算法性能的重要依据之一。文献[15]提出一种旅游情境化推荐模型,该模型是基于用户画像的。通过构建的测试系统对旅游情境化推荐模型进行测试,结果表明,该推荐模型的推荐性能更优。
4 利用上下文信息的推荐技术
常见的上下文(Context)信息(前述技术没有采用)包括:用户的访问时间、所在地点、情感等,而这些上下文对于提升推荐系统性能来说是至关重要的。
常用的基于位置的推荐主要涉及三个方面的内容,包括:数据集、评价方法及评价指标。文献[16]在发现特殊评价方法及指标的基础上,提出一种面向移动推荐系统的四层评价体系,该体系能有机结合基于位置的移动推荐的模型、数据集和评价要素,有助于提升评价的效用。
文献[17]在抽取融合多源数据建立知识图谱和挖掘游记的基础上,创建旅游路线数据库,结合数据库、游客类型和频繁序列挖掘算法产生大量候选路线。最终,利用多维度路线搜索算法及评分机制向用户推荐旅游个性化路线。综合考虑旅行天数、用户类型及偏好,上述推荐能有效提升用户体验。
沈记全等提出一种融合情景上下文和用户信任关系的景点推荐算法[18]。该算法在协同过滤中引入用户信任度而非相似度以缓解数据稀疏的问题,并融合情景上下文来表征不同用户的不同需求,以此建设景点推荐模型和算法。通过在模拟数据集上的对比,相比传统方法,该景点推荐算法表现最优。
5 基于社交网络数据的推荐技术
Facebook、微信以及新浪微博等社交网络平台发展迅猛,积累了数十亿计的用户,社交网络越来越多地融入众多游客的生活中。因此,在基于地理位置服务的社交网络(Location Based Social Networks,LBSNs)[19]中发现用户的兴趣点(Point of Interest,POI)已经成为优化推荐算法的重要研究领域。
文献[20]提出一种基于LBSNs的景点知识发现与推荐算法。在该算法中,设计了POI关系网络的构建模型以提取POI的特征,并建立跨LBSN的POI特征联合学习方法以便融合和推理多维信息,建构基于时间特征的POI推荐模式。
文献[21]提出一种基于LBSN的多目标个性化POI序列推荐框架。在该框架中,选择游客的签到数据作为提取其偏好的依据,综合考虑游客偏好、POI流行度和时空信息等因素,并利用多目标优化算法挖掘POI以形成个性化POI序列(即个性化线路)。实验结果表明,该框架能提升推荐的命中率,满足多样性需求。
6 基于约束的推荐技术
由于现实条件的限制,游客的选择无法做到随心所欲,通常受到空间和时间等因素的约束,因此,基于约束条件的推荐技术更符合现实的应用场景需求。
文献[8]提出了一种基于时空约束的旅游路径推荐算法。该算法从地理学的视域,分析游客空间行为和时间行为约束条件,包括:时间距离和个人偏好等,并改进最短路径算法,构建决策行为个性化应用场景下的高评分景点集合并规划相对应的旅游路径。通过在实验区域的模拟测试,验证了该算法在约束条件下的有效性。
由于节假日大量游客的集中涌入,导致游客满意度的大幅下降,将基于事件社会网络(Event-based Social Networks,EBSN)及其推荐策略引入到个性化旅游推荐中,是一个值得关注的新领域。文献[9]提出在EBSN中的一种考虑约束的全局推荐策略。该策略的全局推荐优化目标是,在满足事件接纳用户容量和时间冲突等约束的基础上,使得不满意度最小化,并建立约束对应的单一目标函数,借助二进制粒子群优化算法BPSO提升推荐优化的性能。文中的策略可以有效地应用于旅游推荐技术中。
7 结 语
个性化旅游推荐技术已成为学术界和产业界的研究热点,本文分析了典型的推荐技术,包括:利用用户行为数据、用户标签数据、上下文信息和基于社交网络数据等,并介绍了近年来的研究进展。同时,介绍了能提升性能效果的混合推荐技术和满足多约束应用场景的基于约束的推荐技术,研究了相关领域的最新成果。
总的来说,个性化旅游推荐技术的研究趋势大致如下:
(1)用户数据是研究的基础。如何从多源的、大量的、龐杂的数据中提取有效数据,如何从数据中提取出相关的上下文信息,发现偏好特征,已成为推荐技术的共性问题之一;
(2)融合多种推荐技术的混合推荐技术是进一步的研究方向之一;
(3)基于游客空间行为约束、时间行为约束和EBSN约束等的推荐技术更符合实际应用需求,是值得深入研究的领域。 参 考 文 献
[1]陈旭.基于众源地理数据的热门旅游路线推荐算法及实证研究
[D].上海:上海师范大学,2018.
[2]李多加. 基于混合推荐算法的旅游推荐系统的设计与实现[D].杭州:浙江大学,2018.
[3]王少兵,吴升.采用在线评论的景点个性化推荐[J].华侨大学学报(自然科学版),2018,39(3):467-472.
[4]郑恩让,韩国锋,刘晨.基于域适应的旅游景点个性化推荐算法研究[J].陕西科技大学学报,2019,37(1):135-139.
[5]陈君同,古天龙,常亮,等.融合协同过滤与用户偏好的旅游组推荐方法[J].智能系统学报,2018,13(6):999-1005.
[6] FENZA G ,FISCHETTI E ,FURNO D ,et al. A hybrid context aware system for tourist guidance based on collaborative filtering [C]// FUZZ-IEEE 2011,IEEE International Conference on Fuzzy Systems. [S.l.]:IEEE,2011: 27-30.
[7]王显飞,陈梅,李小天.基于约束的旅游推荐系统的研究与设计
[J].计算机技术与发展,2012,22(2):141-145.
[8]陈媛,吴胜洁,董春玲.旅游者个人时空间行为约束下的旅游线路推荐[J].绿色科技,2018(21):229-232.
[9]廖国琼,黄志伟.基于事件社会网络中考虑约束全局推荐策略[J].南京大学学报(自然科学版),2018,54(1):11-22.
[10]赵雅楠,王育清.基于不确定近邻的旅游产品协同过滤推荐算法研究[J].数据分析与知识发现,2018,2(7):63-71.
[11]徐宏,陈焰,支艳利,等.基于Apriori改进算法的旅游个性化推荐[J].微型电脑应用,2018,34(1):74-79.
[12]孙彦鹏,古天龙,宾辰忠,等.基于多重隐语义表示模型的旅游路线挖掘[J].模式识别与人工智能,2018,31(5):462-469.
[13]朱桂祥,曹杰.基于主题序列模式的旅游产品推荐引擎[J].计算机研究与发展,2018,55(5):920-932.
[14]邓旭明. 基于深度学习的旅游服务推荐系统研究[D].西安:西北大学,2018.
[15]刘海鸥,孙晶晶,苏妍嫄,等.基于用户画像的旅游情境化推荐服务研究[J].情报理论与实践,2018,41(10):87-92.
[16]孟祥武,梁弼,杜雨露,等.基于位置的移动推荐系统效用评价研究[J].计算机学报,2019(2):1-24.
[17]孙文平,常亮,宾辰忠,等.基于知识图谱和频繁序列挖掘的旅游路线推荐[J].计算机科学,2019,46(2):56-61.
[18]沈记全,王磊,侯占伟,等.基于情景上下文与信任关系的旅游景点推荐算法[J].計算机应用研究,2018,35(12):3640-3643.
[19] BAO J ,ZHENG Y ,WILKIE D ,et al. Recommendations in location-based social networks: a survey [J]. GeoInformatica,2015,19(3):525-565.
[20]徐向阳.基于LBSNs的城市景点知识发现与推荐优化[D].成都:电子科技大学,2018.
[21]李迎. 基于LBSN的个性化多目标旅游路线推荐[D].长沙:湖南大学,2018.
[22] HAO Q,CAI R,WANG C,et al. Equip tourists with knowledge mined from travelogues [C]// Proceedings of the 19th International Conference on World Wide Web. Raleigh,North Carolina: IEEE,2010:26-30.
[23]孟祥武,李瑞昌,张玉洁,等.基于用户轨迹数据的移动推荐系统研究[J].软件学报,2018,29(10):3111-3133.
[24] YING J C,LEE W C,TSENG V S. Mining geographic-temporal-semantic patterns in trajectories for location prediction [J]. ACM transactions on intelligent systems and technology,2013,5(1): 1-33.
[25] NILASHI M,BIN LBRAHIM O,LTHNIN N,et al. A multi-criteria collaborative filtering recommender system for the tourism domain using Expectation Maximization(EM)and PCA-ANFIS [J]. Electronic commerce research and applications,2015,14(6): 126-140.
转载注明来源:https://www.xzbu.com/8/view-15151395.htm