您好, 访客   登录/注册

基于用户行为分析和LDA模型的数字媒体推荐系统的设计与实现

来源:用户上传      作者:

  摘  要: 为了提高数字媒体推荐能力,提出基于用户行为分析和LDA模型的数字媒体推荐系统的设计方法。构建数字媒体推荐的大数据信息采集和项目分布模型,采用关联规则调度的方法,提取数字媒体的用户行为本体特征,建立数字媒体推荐的用户行为特征检测模型。在LDA模型中,进行数字媒体推荐的模糊决策调度和特征映射处理,结合模糊C均值聚类方法,进行数字媒体推荐中用户行为特征的自适应聚类,计算数字媒体用户行为的联合信息熵,根据熵权分布进行数字媒体推荐模型的算法优化设计。在B/S构架体系下进行数字媒体推荐系统的软件开发设计,仿真实验结果表明,采用该方法进行数字媒体推荐的准确性较高,误差较小,提高了数字媒体推荐的实时性和满意度水平。
  关键词: 数字媒体推荐系统; 用户行为分析; LDA模型; 行为特征提取; 信息采集; 自适应聚类
  中图分类号: TN911.1?34; TP391                   文献标识码: A                    文章编号: 1004?373X(2020)07?0146?04
  Design and implementation of digital media recommendation system
  based on user behavior analysis and LDA model
  LI Sansan
  (Department of Computer Science and Engineering, Guangzhou College of Technology and Business, Guangzhou 510850, China)
  Abstract: In order to improve the ability of digital media recommendation, a design method of digital media recommendation system based on user behavior analysis and LDA model is proposed. The big data information collection and item distribution model for digital media recommendation is constructed. The ontology features of user behavior of digital media are extracted with association rule scheduling method. The user behavior feature detection model for digital media recommendation is established. The fuzzy decision scheduling and feature mapping processing of digital media recommendation are carried out in LDA model. The adaptive clustering of user behavior feature in digital media recommendation is performed by combining fuzzy C?means clustering method. The joint information entropy of digital media user behavior is calculated. The algorithm optimization design of digital media recommendation model is conducted according to the entropy weight distribution. The software development and design of digital media recommendation system are carried out in the architecture system of B/S, and the simulation results show that the method for digital media recommendation has high accuracy and small error, which has improved the real?time performance and satisfaction level of digital media recommendation.
  Keywords: digital media recommendation system; user behavior analysis; LDA model; behavior feature extraction; signal acquisition; self?adaptive clustering
  0  引  言
  随着数字媒体技术的发展,大量的数字媒体信息通过网络传播,数字媒体中的音视频资源以及图像资源在传播过程中受到用户的偏好影响,需要进行优化调度,建立数字媒体的智能推荐模型。采用数字化的交互平台进行数字媒体推荐系统设计,提高了数字媒体的服务质量水平[1],研究数字媒体推荐系统的优化设计方法,结合大数据挖掘和资源的调度进行数字媒体的智能推荐,提高了数字媒体交互平台的信息融合和自适应推荐能力。对数字媒体的信息推荐是建立在对数字媒体信息的挖掘和用户行为特征检测的基础上,通过构建数字媒体的大数据信息检测和融合模型[2],将各类型的数字媒体信息融合到网络空间中,形成多媒体组网下的数字媒体信息交互平台,本文提出基于用户行为分析和LDA模型的数字媒体推荐系统的设计方法。首先,构建数字媒体推荐的大数据信息采集模型;然后,建立数字媒体推荐的用户行为特征检测模型,在LDA模型中进行数字媒体推荐;最后,进行仿真实验分析,展示了本文方法在提高数字媒体推荐能力方面的优越性能。   1  数字媒体推荐的大数据分析
  1.1  数字媒体推荐的项目分布
  为了实现数字媒体的智能推荐,需要首先构建数字媒体推荐的大数据信息采集模型,采用关联规则调度的方法提取数字媒体的用户行为特征量[3],并对推荐结果进行评分预测。假设数字媒体的推荐训练样本为[{(x1,y1),(x2,y2),…,(xn,yn)}],其中,现用户偏好的最近邻集合[xi∈Rn],表示数字媒体推荐的历史行为数据,结合用户行为的偏好进行语义本体重建[4],得到数字媒体的个性化推荐的演化目标函数为:
  [minimize 12w2+Ci=1n(ξi+ξ*i)s.t.    yi-(wΦ(xi)+b)≤ε-ξi          (wΦ(xi)+b)-yi≤ε-ξ*i          ξi,ξ*i≥0,    i=1,2,…,n;C>0] (1)
  式中:[ξi]和[ξ*i]表示用户行为信息获取的维度及差异特征量。
  采用协同过滤算法进行用户集合和项目集合的关联性特征检测,建立数字媒体推荐的混合核函数,其表达式为:
  [Kmin=βKpoly+(1-β)Krbf, β∈(0,1)] (2)
  式中,[Kpoly=[(x?xi)+1]2],表示数字媒体推荐过程中的个性化演化特征分布函数。提取数字媒体的用户行为特征量,采用模糊关联规则调度的方法进行用户行为分析和本体结构映射[5],结合互信息检测的方法进行用户行为推荐。根据用户在浏览网站时的行为特征,构建数字媒体的联合推荐的模糊决策模型,得到模糊决策函数为:
  [flg?M(z)=(flg(z),flg?x(z),flg?y(z))=(flg(z),hx?flg(z),hy?flg(z))]     (3)
  式中[flg(z)]表示数字媒体推荐的用户项目评分值。根据共同评分的项目分布,进行数字媒体大数据信息采集。
  1.2  用户行为本体特征提取
  在推荐系统中,采用相似度计算方法进行关联规则调度,提取数字媒体的用户行为本体特征,建立数字媒体推荐的行为特征量[6],计算数字媒体推荐的联合信息熵特征,表示为:
   [JInTB=2JSNsincπΔfTC×i=0N-1cicos2πΔfTCnN+i+12+φj] (4)
  基于标签的个性化推荐方法,进行数字媒体的用户行为特征检测[7],得到数字媒体推荐的联合分布概率密度函数描述为:
  [fT1,T2,…,Tn(t1,t2,…,tn)=cFT1(t1),FT2(t2),…,FTn(tn)i=1nfTi(ti) =2π-n2Σ-12exp-12FT(t)-μ′Σ-1FT(t)-μ?i=1nfTi(ti)                                                                                    (5)]
  式中:[FTt=(F1t, F2(t),…,FNt)],基于个性化推荐的方法,建立数字媒体用户行为特征的元数据表达模型,采用C均值聚类方法进行用户行为本体特征提取[8],得到数字媒体用户行为特征检测的关联规则分布集描述为:
  采用协同过滤推荐的方法进行数字媒体个性化推荐过程的自适应学习,以[C]为数字媒体用户行为推荐的融合度因子,将信任关系信息加入到推荐模型中[9],得到数字媒体个性化推荐的语义本体函数为:
  [f(x)=i=1n(αi-α*i)K(xi,xj)+b]       (7)
  式中:[αi]和[α*i]表示数字媒体个性化推荐的标签语义特征量;[K(xi,xj)]是模糊核函数;[b]表示用户集合和项目集合的推荐门限。根据上述分析,构建数字媒体用户行为本体特征提取模型,根據特征提取结果进行数字媒体的调度和优化推荐[10]。
  2  数字媒体推荐算法优化
  2.1  用户行为特征检测
  在上述构建数字媒体推荐的大数据信息采集和项目分布模型的基础上,进行数字媒体推荐系统的优化设计。本文提出基于用户行为分析和LDA模型的数字媒体推荐系统的设计方法。采用关联规则调度的方法提取数字媒体的用户行为本体特征,提取数字媒体的用户行为的本体信息,采用模糊语义相关性检测的方法[11]进行数字媒体推荐过程中的优化调度,得到用户行为的量化评估特征集为:
  [FZλt0k=pT1+T2+…+Tn≤λt0k=…ft1, t2 ,…,tnZ≤λt0k                                                    dt1dt2…dtn] (8)   [FZt0k=pT1+T2+…+Tn≤t0k=…ft1, t2 ,…,tnZ≤t0k                                                    dt1dt2…dtn] (9)
  式中[Z=T1+T2+…+Tn],建立数字媒体推荐的用户行为特征检测模型,根据用户行为的结构特征进行数字媒体学习用户的行为特征分析[12],建立数字媒体推荐的判决函数为:
  [f(x)=SINR-20exp-0.21Dd=1Dx2d-exp1Dd=1Dcos(2πxd)]    (10)
  式中[SINR]為数字媒体推荐的检测阈值。对特征向量进行聚类,构建用户行为特征的演化分布模型,采用相似性度量方法得到推荐的规则函数为:
  [   Simsgt+Δt=fSAmsgt,S1msgt,…,Snmsgt,S1ctxtt,…,Snctxtt,                           ?i∈A,1,2,…,nSictxtt+Δt=fSActxtt,S1ctxtt,…,Snctxtt,                           ?i∈A,1,2,…,n](11)
  采用相似度计算的方法进行推荐过程中的用户行为特征集的模糊调度,实现用户行为特征检测[13]。
  2.2  数字媒体推荐的LDA模型
  结合模糊C均值聚类方法进行数字媒体推荐中用户行为特征的自适应聚类,计算数字媒体用户行为的联合信息熵,联合信息熵分布时间序列为[x(t)],[t=0,1,2,…,n-1],在关联规则约束规则下,得到数字媒体推荐的联合概率分布函数为:
  [Ecv(c1,c2)=μ?Length(C)+v?Area(inside(C))+        λ1inside(C)I-c12dxdy+λ2outside(C)I-c22dxdy] (12)
  式中:[c1]和[c2]分别表示数字媒体推荐的个性化演化特征系数;[Length(C)]表示待推荐的数字媒体行为信息的长度;[Area(inside(C))]表示区域分布;第[i]个类的数字媒体推荐的模糊隶属度特征量记为[CF=F,Q,n,RT1,RT2,RW]。在LDA模型中进行数字媒体推荐的模糊决策调度[14],得到LDA寻优模型如图1所示。
  根据上述构建的数字媒体推荐的LDA模型,进行自适应寻优,实现数字媒体推荐的LDA模型设计,提高推荐的准确性[15]。
  3  系统的软件开发设计与实现
  在上述进行数字媒体推荐系统的算法设计基础上,进行数字媒体推荐系统的软件设计。在物联网技术环境下建立数字媒体推荐的信息调度模型,采用模糊关联规则调度的方法进行数字媒体推荐过程汇总的信息调度。在ZigBee组网协议下建立数字媒体推荐系统的网络中心,采用ZigBee和GPRS等网络组网方法进行数字媒体推荐系统的网络模块化开发设计,基于TCP/IP进行数字媒体推荐系统的总线开发[16],建立数字媒体推荐系统的TCP/IP服务器或UPD服务器。采用MySQL构建数字媒体管理数据库,在B/S结构体系下进行数字媒体推荐系统的网络设计,得到数字媒体推荐的网络控制模块如图2所示。
  根据网络开发协议,采用IEEE 802.15.4协议标准进行推荐系统的B/S构架体系设计,通过VME总线或局部总线传输技术进行数字媒体推荐系统的软件体系开发,实现流程如图3所示。
  4  仿真实验分析
  在实验中,采用Matlab 7进行数字媒体推荐系统的测试,结合Visual C++进行数字媒体推荐算法开发,数字媒体信息的采样时间长度设定为120 ms,数据规模集为2 000,统计样本序列的宽度为[ρSM=50],采样幅值[ASM=6],关联维度[DSM=5],嵌入式延迟[Cm=1],自适应空间采样频率[gNa=3],其他参数设定[gT=5],[ENa=50],[EK=-90],[EL=-70],[ET=120]。根据上述参数设定,构建数字媒体推荐的大数据信息采集和项目分布模型,得到原始的数字媒体信息采集如图4所示。
  以图4采样的数字媒体信息为测试对象,在LDA模型中进行数字媒体推荐的模糊决策调度和特征映射处理,结合模糊C均值聚类方法进行数字媒体推荐中用户行为特征的自适应聚类,实现数字媒体推荐,得到推荐精度对比输出如图5所示。
  测试推荐的召回率,得到对比结果见表1。分析得知,本文方法进行数字媒体推荐的准确性较好,召回率较高。
  5  结  语
  研究数字媒体推荐系统的优化设计方法,结合大数据挖掘和资源的调度,进行数字媒体的智能推荐,提高了数字媒体交互平台的信息融合和自适应推荐能力。本文提出基于用户行为分析和LDA模型的数字媒体推荐系统的设计方法。采用关联规则调度的方法提取数字媒体的用户行为本体特征,建立数字媒体推荐的用户行为特征检测模型。在LDA模型中进行数字媒体推荐的模糊决策调度和特征映射处理,结合模糊C均值聚类方法进行数字媒体推荐中用户行为特征的自适应聚类,根据熵权分布进行数字媒体推荐模型的算法优化设计。采用IEEE 802.15.4协议标准进行推荐系统的B/S构架体系设计,实现推荐系统优化设计。研究得知,本文方法进行数字媒体推荐的精度较高,召回率较好。   参考文献
  [1] 杨丰瑞,郑云俊,张昌.结合概率矩阵分解的混合型推荐算法[J].计算机应用,2018,38(3):644?649.
  [2] DURAO F, DOLOG P. Improving tag?based recommendation with the collaborative value of Wiki pages for knowledge sharing [J]. Journal of ambient intelligence humanized computing, 2014, 5(1): 21?38.
  [3] 张付志,刘赛,李忠华,等.融合用户评论和环境信息的协同过滤推荐算法[J].小型微型计算机系统,2014,35(2):228?232.
  [4] 张永,李卓然,刘小丹.基于主动学习SMOTE的非均衡数据分类[J].计算机应用与软件,2012,29(3):91?93.
  [5] BULUT E, SZYMANSKI B K. Friendship based routing in delay tolerant mobile social networks [C]// Proceedings of 2010 IEEE Global Telecommunications Conference. Miami, Florida, US: IEEE, 2010: 1?5.
  [6] BULUT E, SZYMANSKI B K. Exploiting friendship relations for efficient routing in mobile social networks [J]. IEEE transactions on parallel and distributed systems, 2012, 23(12): 2254?2265.
  [7] 汤可宗,肖绚,贾建华,等.基于离散式多样性评价策略的自适应粒子群优化算法[J].南京理工大学学报,2013,37(3):344?349.
  [8] 张鹏飞,王宜贵,张志军.融合标签和多元信息的个性化推荐算法研究[J].计算机工程与应用,2019,55(5):159?165.
  [9] 郭磊,马军,陈竹敏,等.一种结合推荐对象间关联关系的社会化推荐算法[J].计算机学报,2014,37(1):219?228.
  [10] 涂丹丹,舒承椿,余海燕.基于联合概率矩阵分解的上下文广告推荐算法[J].软件学报,2013,24(3):454?464.
  [11] 孟祥武,刘树栋,张玉洁,等.社会化推荐系统研究[J].软件学报,2015,26(6):1356?1372.
  [12] FANG H, BAO Y, ZHANG J. Leveraging decomposed trust in probabilistic matrix factorization for effective recommendation [C]// Proceedings of the 28th AAAI Conference on Artificial Intelligence. Qubec City, Canada: AAAI, 2014: 30?36.
  [13] YAHYAOUI H, AL?MUTAIRI A. A feature?based trust sequence classification algorithm [J]. Information science, 2016, 328: 455?484.
  [14] 吴铮,于洪涛,刘树新,等.基于信息熵的跨社交网络用户身份识别方法[J].计算机应用,2017,37(8):2374?2380.
  [15] 刘东,吴泉源,韩伟红,等.基于用户名特征的用户身份同一性判定方法[J].计算机学报,2015,38(10):2028?2040.
  [16] ROEDLER R, KERGL D, RODOSEK G D. Profile matching across online social networks based on Geo?tags [C]// Procee?dings of the 7th World Congress on Nature and Biologically Inspired Computing. Berlin: Springer?Verlag, 2016: 417?428.
转载注明来源:https://www.xzbu.com/8/view-15245399.htm