基于AdaBoost与BP神经网络增量学习的手机用户分类预测
来源:用户上传
作者: 张冉
摘要:随着3G网络的全面普及,手机广告目前已逐渐成为商家抢占市场的一种营销手段,但手机广告投放的精准性是目前比较突出的一个问题。本文介绍了BP神经网络以及AdaBoost算法的基本原理,研究了应用AdaBoost结合BP神经网络算法的增量学习模型,该模型基于用户历史点击记录来预测手机用户感兴趣的广告类别,以提高手机广告投放的精准度。
关键词:手机用户分类;AdaBoost;BP神经网络;增量学习;手机广告
中图分类号:TP274 文献标识码:A 文章编号:1007-9599 (2011) 23-0000-01
Mobile Phone Users Classification Forecast Based on AdaBoost and BP Neural Network Incremental Learning
Zhang Ran
(Sun Yat-sen University,Guangzhou 510006,China)
Abstract:With the overall popularity of 3G networks,mobile advertising business has become a marketing tool to seize the market,but the precise nature of mobile advertising is a more prominent issue.This article describes the BP neural network and the basic principles of AdaBoost algorithm to study the application of BP neural network algorithm AdaBoost with incremental learning model that records based on user click history to predict the mobile phone users are interested in advertising categories,in order to improve the mobile advertising the accuracy.
Keywords:Phone user classification;AdaBoost;BP neural network;Incremental learning;Mobile advertising
一、引言
随着移动无线第三代网络技术的迅速普及以及智能手机的飞速发展,手机广告作为继传统媒体报纸、杂志、广播、电视的第5代媒体平台吸引着广大商家的眼球。根据工信部调查数据显示,截至今年4月底,我国手机用户已突破9亿户大关,其中3G用户总数为6757万户,因此手机广告是推销产品的另一有效途径。但目前商家投放广告的方式十分粗放,缺乏目标性,收效甚微。
手机广告针对用户的投放具有实时性,同时手机用户的兴趣及需求也是随时间不断发生变化的,致使不能一次性获得全部训练样本以得到适当的网络结构。
针对上述问题,本文在研究AdaBoost方法结合BP神经网络算法的基础上,提出了增量学习模型应用于手机用户分类。增量学习是对所获得的数据逐步学习,预测结果是基于逐步学习的基础上所得,这充分利用手机用户历史点击记录数据,对手机用户的分类进行预测,并根据预测结果投放相应类别的手机广告,从而得到较为理想的广告投放效果。
二、BP神经网络
BP神经网络是基于误差传播的多层前馈网络算法,标准的BP神经网络由输入层、隐含层及输出层三层神经元构成,其中隐含层可为一层或多层,其主要特征为:相邻两层神经元之间采用全互连方式,各层内神经元之间无连接。输入信号传播到隐含节点,经隐含节点的转换和处理,再传播至输出节点,最后经输出节点的转换和处理得到输出结果。模型结构见图1
图1 三层BP网络的拓扑结构
每层神经元与下一层所有的神经元连接,箭头表示信息的流动。其中xi表示输入层第i个神经元的输入信号,ωij表示输入层与隐层之间的连接权重,ωjk表示隐层与输出层之间的连接权重,yj表示隐层神经元,ok表示输出层第k个神经元的输出信号。
假定输入层数为n,输出层数为m,那么BP网络便是一个从n维欧氏空间到m维欧氏空间的映射。
BP学习算法把学习过程分为两个阶段:信息正向传播和误差反向传播。
三、AdaBoost算法
AdaBoost算法的基本思想是针对不同的训练集训练同一个基本分类器,然后把这些不同训练集上得到的分类器联合起来,构成一个最终的强分类器。在基本分类器的分类能力比随机猜测好的情况下,则可以得到好的分类效果。
四、基于增量学习的手机用户分类模型
(一)手机用户特征分析
手机广告的投放可根据对用户特征的分析,依据分析结果为手机用户投放其感兴趣的广告,从而提高其投放的精准度,减少用户查找感兴趣商品的同时也可以给广告主带来收益。
手机用户的特征可分为静态特征和动态特征两类:
静态特征:手机号码,姓名,性别,年龄,城市,行业,收入水平,兴趣爱好。
动态特征:用户点击过的手机广告的次数,点击时间,点击广告类别。
(二)增量学习算法描述
增量学习需要满足以下条件:
(1)能够从获得的新数据中学到知识;
(2)在学到新知识的同时要保留以前所学知识;
(3)不需要对以前的数据进行重新学习。
增量学习算法描述:
针对每一批数据样本集执行如下步骤:
(1)初始化样本的分布Dt;
(2)根据样本分布Dt,通过对训练集S进行抽样(有回放)产生训练集St。
在训练集St上训练分类器ht;
(3)用分类器ht对原训练集S中的所有样本分类,得到本轮的分类器ht:X→Y,并计算分类误差及分类器的权重;
(4)更新每个样本的权值;
(5)循环至产生T个弱分类器;
(6)依各分类器的权值得出强分类器的预测结果
对到达的N个不同训练数据集,依据上述步骤产生N个不同的强分类器,每个强分类器产生一个输出结果,对N个强分类器的结果求加权和,值最大者便为对应的用户感兴趣类别,即最终的输出结果。
五、结论
本文通过对手机用户特征分析,得到手机用户的静态特征及动态特征。并在研究BP神经网络算法以及AdaBoost方法的基础上,提出了增量学习模型,静态特征及动态特征作为该模型的输入,用户感兴趣的广告类别作为该模型的输出,通过对手机用户点击广告产生的历史信息记录进行增量学习,从而达到对未知用户感兴趣广告类别的精准预测。
参考文献:
[1]基于3G技术的手机广告模式问题研究及对策分析[J].消费导刊,2010,1
[2]廖宇.手机广告运营模式的设计及其实现研究[D].电子科技大学,2009,11
转载注明来源:https://www.xzbu.com/8/view-44402.htm