城市多源数据投放位置推荐算法的研究
来源:用户上传
作者:
摘要:本文融合城市出租車交通数据、城市路网数据以及城市兴趣点(Point of Interest,POI)数据,通过刻画用户出行的潜在意图,提出了面向潜在目标用户的户外广告影响力量化模型;同时基于城市商业基础设施与公共交通设施分布情况,设计了户外广告在不同空间区域投放的定价策略。在此基础之上,形式化定义了广告影响力-投放成本两优化目标的户外广告精准投放位置推荐问题,通过对传统G-Skyline查询算法的改进,基于最大支配数计算以及高效剪枝策略设计了位置推荐查询算法。在真实数据集上的实验结果验证了本文所提相关方法的有效性。
关键词:户外广告投放;Skyline查询;移动轨迹数据
中图分类号:TP391 文献标识码:A 文章编号:1007-9416(2020)02-093-02
1 户外广告影响力传播及定价模型
1.1 用户出行意图刻画
在出租车轨迹数据中,行程的轨迹T由位置序列 表示,轨迹位置由{lon, lat}表示。通过行程T的目的地附近的POI类型建立向量空间模型,以刻画乘客的出行意图,其中的表示POI类别为i的概率。
目的地为路段r的所有行程,它们的出行意图向量分别为,那么在路段r上的出行意图向量可表示为:
本文采用广告投放位置的乘客出行意图分布向量和广告本身的内容主题向量之间的匹配程度来量化表征广告投放的精准程度:
1.2 户外广告传播影响力模型
基于出租车的行程轨迹,本文综合车流量和车速两方面因素定义了路段r上的广告曝光强度为:
其中c1和c2分别是fw和v的调节参数。
当给定一个广告查询q,那么q在路段r上的传播影响力可以用r上的广告曝光强度和对应的广告匹配度来量化,具体公式可表示为:
1.3 户外广告定价机制
本文从多个不同的影响因素出发综合构建了户外广告定价机制。房地产价格与人口密度具有正相关性,用PriceEst(r)来表示道路r附近小区的房产价格;城市道路上的交通设施情况,主要体现在公交站数量、途径的公交车线路数量以及与最近地铁站的距离上。定义路段r上的广告投放价格。房产价格是实际的价格指标,所以以房价为基础构建线性模型:
其中ω和b受到路段r的其他条件限制。ω值受到交通环境的影响:
其中和分别表示最大公交站数和最大公交线路数量。取,表示与地铁站的距离上限取5000米。公交线路数量和公交站数量越大则ω值越大,而与地铁站的距离越小则ω值越大,ω值一般大于等于1。j是用来调节ω值范围的参数,范围在(0,1)之间。将和线性组合得到:
其中出租车的车流量和商业得分带来的价格增量分别为和,a1和a2为调节参数。
2 基于G-Skyline的户外广告位置推荐
2.1 户外广告查询问题
定义1(户外广告推荐):给定一个广告查询q和城市范围内的位置集合。户外广告位置推荐问题是在S中查找一组位置进行广告投放。具体的需要在所有的位置组合中搜索满足目标函数的最优组。目标函数如下:
其中表示G的整体成本,表示G的整体影响力。户外广告位置推荐问题希望能够同时兼顾广告传播的影响力和投放成本。
2.2 改进的G-Skyline查询
定义2(支配数):设,ri的支配数表示ri所支配位置的数量,用表示。G的支配数表示G中所有位置支配数之和,表示为。
在位置集合S的Skyline层中,低层位置至少在一个维度上优于高层,同一层位置的支配数越大,则其成本和影响力越均衡,更适合被选择作为广告投放的目标位置。改进的G-Skyline查询算法只需要计算得到支配数最大的G-Skyline组,所以在Skyline层的前k层中,如果有,则可以将ri从有DSG中删除,达到对DSG进行简化的目的。
3 实验评价
本节对所提出的方法在真实数据集上进行实验仿真以验证算法的相关性能。所采用的基准方法包括:(1)加权法WS;(2)传统的G-Skyline查询方法。
加权法WS主要是采用加权思想将两个目标转换为单目标问题求解,把问题简单处理为求最大值的问题,在候选的位置集合中直接选择目标函数值最大的位置作为广告查询q的投放位置。所以目标函数可以定义为:
其中,h1和h2分别是和的调节参数,用来调节两者的权重。
当选择不同的k时,3种算法的耗时对比如图1所示,其中改进的G-Skyline查询算法在时,随着k值的不断增大,其运行效率上的优势越来越明显。由于G-Skyline组不能被其他的组所支配,所以如图2,图3所示G-Skyline查询算法的平均影响力优于WS算法。
4 结论
本文提出了改进的G-Skyline查询算法,该算法优先计算支配数最大的G-Skyline组,最大程度减少了广告投放位置的候选组合。
Research on Urban Multi-source Data Placement Recommendation Algorithm
WANG Lei ,WANG Liang,GUAN Ru-jun
(Department of Electrical and Control Engineering, Xi’an University of Science and Technology, Xi'an Shaanxi 710054)
Abstract:This paper combines urban taxi traffic data, urban road network data and city point of interest (POI) data. By portraying the potential intention of user travel, this paper proposes an outdoor advertising influence power model for potential target users. At the same time, based on the distribution of urban commercial infrastructure and public transportation facilities, the pricing strategy of outdoor advertising in different spatial regions was designed. On this basis, this paper formalizes the recommendation of outdoor advertising precision placement for advertising influence-delivery cost optimization goal. By improving the traditional G-Skyline query algorithm, the location recommendation query algorithm is designed based on the maximum dominance calculation and efficient pruning strategy.
Key words:outdoor advertising; G-Skyline query; trajectory data
转载注明来源:https://www.xzbu.com/8/view-15192822.htm