您好, 访客   登录/注册

机器学习在推荐系统中的应用

来源:用户上传      作者:

  摘要:我国科技技术在社会经济建设的背景下有了较快的发展,其中机器学习是我国目前较为流行的一种技术,并且应用在较多的领域中,比如生物、信息以及交通等,特别是经济以及金融领域,有较高的应用效果。此外,在经济以及金融领域中应用机器学习的过程中,需要对不同算法中的优点与缺点进行实施有效的分析,并能在此基础上对目前整个环境进行有效的了解,通过机器学习进行用户推荐系统的构建,以此对不同算法的适应情况进行深入的了解。
  关键词:机器学习;推荐系统;应用
  中图分类号:TP391 文献标识码:A
  文章编号:1009-3044(2019)11-0196-02
  前言
  我国信息化技术的发展,使较多数据得到有效的存储,同时科技技术在应用过程中也出现了较多的数据,在一定程度上很难得到有效的利用。因此,需要对一些数据进行有效的挖掘,较多数据挖掘技术在不同领域中应用,其中机器学习技术的应用范围比较广泛,由此能够看出,機器具有强大的学习能力,能够在推荐系统中进行有效的应用。
  1 机器学习的过程
  1.1 数据获取
  机器学习在运行过程中,首先是采取有效的途径进行数据的获取,由此可以看出,机器学习需要建立在数据的基础之上,其中获取数据是机器学习运行过程中最为简单的步骤,主要是因数据的产生渠道较多,并且产生的数据量也相对较多,比如医院就诊记录、超市购买记录以及电脑运行数据等,这些数据信息在较大程度上是机器学习的基础。
  1.2 清洗数据
  由于数据无规则性,人们在获取的过程中也有较大的无规则性,在此过程中有较多数据没有可利用价值,反之还会对系统运行造成一定的不利影响,所以在对此进行分析过程中应当首先对此无用信息进行有效清理,这在较大程度上能够有效提高分析结果正确率[1]。此外,在对数据处理的过程中有三个不同的方面:距离度量、抽样以及降维。
  在协同过滤推荐系统中采用KNN分类,一般情况下取决于距离度量方法,使用频率最高的距离度量方法有皮尔逊相关系数、欧几里得距离以及Jaccard系数等。此外,抽样技术主要是对数据进行有效的挖掘,从大数据集中选择相关数据子集的一种技术,并且在最终的解释步骤也起到了较为重要的作用,其中无取代抽样是使用频率最为高的抽样方法,若对物品选择确定之后,物品会被取走,但是执行取代抽样也是允许的,换句话说就是物品就算被选择也无需从整体中去除。降维主要是对一些点的去除,一般情况下是对密集度不高并且对结果影响较小的点实施有效的去除,并在此基础上进行维度的有效降低,以此在最大程度上避免维度灾难。
  1.3 模型构建以及数据分析
  在机器学习的过程中,对数据的分析是整个过程中难度最大,并且最核心的环节,的整个机器学习中最为核心的内容。此外,在对数据分析过程中,所采用的方法相对较多,不同的方法在使用的过程中会产生不同作用,这就需要在使用过程中根据实际情况进行针对性分析,推荐系统在应用的过程中主要采用了以下几种方法[2]:1)最近邻算法。最近邻算法主要是根据存储蓄念记录对样本标签类别进行有效的预测,此种分类器主要是对训练集进行有效的存储,在此过程中想要进行有效的分类,需要将训练集与新记录进行有效的匹配。此种方法与其他方法相比相对较为简单,主要是因最近邻算法不需要进行模型的构建,具有较高准性;2)人工神经网络。人工神经网络算法在一定程度上是对生物网络进行了有效的模拟,主要是有内连接点与带权链构成,这在较大程度上是模式匹配算法,一般情况下是对回归与分类问题进行有效的解决。人工神经网络主要是机器在学习过程中的一个分支,算法相对比较多,其中最为重要的是一个组成部分就是深度学习。人工神经网络在应用的过程中最大的优势在于能够对非线性分类任务进行有效的处理,并在此基础上进行并行处理,使其在一些网络受损过程中进行实时性操作。但是,人工神经网络系统对一些问题很难提供理想的网络拓扑。
  2 推荐系统
  2.1 系统架构
  目前,推荐系统主要由有关物品检索、物品排序以及用户体特征提取构成。其中物品检所以主要是根据用户特点,能够在最短时间内寻找用户感兴趣的物品,一般情况下此模块主要通过信息检索对物品实施检索,以此快速找到用户感兴趣的物品。排序模块主要是根据机器学习算法,并在此基础上对相关指标实施有效的完善,以此在最大程度上得到有效的模型,比如点击率模型能够通过候选物品特点以及用户特点,可有效预算处用户对物品预估点击率,再将候选物品根据点击率实施合理的排序,主要是根据预估点击率实施有效的排序,同时在排序过程中还需要对结果多样性以及新颖性进行全面、科学的考虑。永特特点提取模块能够对用户行为进行有效的记录,并在此基础上与相关信息构成用户特点,这在较大程度上能够对用户兴趣进行有效的描述。
  2.2 用户特点获取与聚类算法
  以此图书网站作为讲解的例子,用户根据自己的需求登录网站,推荐系统在最短时间内会对该用户特点进行有效的提取,系统会给用户推荐一些与用户兴趣相关的图书。其中用户特点主要表现在以下几点:1)购书过程中的登录身份;2)用户年龄以及性别;3)用户在登录网站后浏览过的网页;4)用户在网站中使用的相关词汇;5)用户在图书网站中的一些其他活动,比如评论、收藏等。
  在所有的用户特点中,性别与年龄维度相对较低,其他特点相对较高,若将此直接作为特点会在一定程度上产生一些问题,比如稀疏性问题,其中最为重要的问题就是导致检索模块运算量相对增加,这在较大程度上使系统中的一些功能降低[3]。检索模块在运行的过程中需要提高其运行效率,推荐系统通过一些措施进行有效的降维,其中降维主要是机器学习过程中无监督学习状态,最为有效的降维方法就是将用户实施有效聚类,比如根据用户历史记录将其进行分类。
  2.3 物品检索   系统寻找到用户兴趣特点后,推荐系统会根据相关信息找打用户物品,推荐系统在进行物品检索的过程中主要是通过导牌索引技术来来完成, 此模块主要的工作是通过倒排索引进行检索,推荐系统中最为主要的索引就是“物品--物品”索引。此外,推荐系统在进行问题探究过程中主要是对物品之间相关度进行有效的计算,同时一些物品推荐系统一般情况下是在用户欣赏物品的过程中,系统根据用户兴趣提供与之相关的物品[4]。目前,主流物品相关度具体算法主要有内容方面算法以及行为方面算法,其中协同过滤算法主要构成就是行为物品相关度算法,这在较大程度上与机器学习行业的关联性准则有较大的关联性。
  3 点击率预估以及两类分类问题
  在得到用户候选物品后,需要对候选物品进行有效的排序,虽然通过物品检索模块能够获得用户特别以及物品相关度,但是不能只通过相关度排序主要是因特点不同得到的相关度有较大的差异性,两者之间不能进行有效的对比。此外,需要一个有效并且统一指标对用户检索物品的有效实施有效的计算工作,以此达到对物品有效排序的目的,其中该统一的指标需要满足不同的条件才能发挥其有效性,主要表现在以下两个方面[5]:1)能够对机器学习方法与算法进行全面的优化;2)在使用的过程中对推荐系统相关网站的使用目标。除此之外,点击率也需要满足不同的条件:1)网站在运行过程中点击率是能够有效提高运行时长,这在较大程度上也是网站运行一个较为重要的目标;2)点击率预算在网站运行中尤为重要,可以将其转变为之前两类分类问题,这在较大程度上是最为主要的问题,由此可以看出,点击率预估模块主要是对物品点击率进行实时性有效计算,再将物品根据点击率高低进行有效排序,并在此基础上进行输出工作。
  在点击率预估模块中需要将不同单一问题转变成两类分类问题,这就需要进行两类分类问题数据集的全面构建,其中数据集主要是有特征与类标组成[6]。此外,两类分类器最具代表的就是神经网络、支持向量机以及逻辑回归等,在进行点击率预估过程中分类器起到了关键性作用,需要满足以下条件:1)在较大范围数据集中进行分类器模型的有效训练;2)需要对样本的正、负类进行全面了解,并在此基础上还需要对样本正样本几率进行有效的认识,以此对点击率实施预估;3)能夠对点击率畸形实时性更新并增量;4)能够满足在线预估要求;5)能够进行预估点击率信用度的全面提供;6)能够进行预估结果的相关解释。目前,一种较为准备的分类算法就是逻辑回归算法,能够有效对以上几点同时满足,其中此种算法在较大程度上是一种线性模型,可对在线预测行性能进行有效的提高,并保持不变,目前对于模型训练有一定的并行化方法,能够在数据集中进行有效的使用。
  4 结语
  综上所述,在机器学习的较多算法当中,在推荐系统中均有较高的应用效果。推荐系统在设计过程中,应当具有产品转化的功能,在产品需求转化为机器学习问题能力,能够在较大程度上对机器学习研究方向以及不同算法进行有效的掌握,并且在此基础上把不同算法在不同领域中有针对性的应用效果,能够在较大程度上提高系统效果,只有这样才能使系统设计达到一个相对较高的水平,以此能够有效提升机器学习效率。
  参考文献:
  [1] 刘忠宝. 机器学习方法在个性化推荐系统中的应用[J].情报探索,2016(4):80-82.
  [2] 周齐. 基于机器学习的推荐系统[J]. 电子技术与软件工程,2016(24):173.
  [3] 齐帅彬, 胡晨骏, 胡孔法,等. 基于机器学习及中医理论的推荐系统研究与思考[J]. 江苏科技信息, 2017(10):37-38.
  [4] 卢军, 张天凡. 基于隐式用户行为的推荐系统研究[J].湖北工程学院学报,2016(3):22-27.
  [5] 王磊. 基于机器学习技术的LTE网络智能优化系统设计[J].电信工程技术与标准化,2018(1):39-42.
  [6] 乔雨, 李玲娟. 融合用户相似度与评分信息的协同过滤算法[J].南京邮电大学学报:自然科学版, 2017(3):100-105.
  【通联编辑:唐一东】
转载注明来源:https://www.xzbu.com/8/view-14769830.htm