您好, 访客   登录/注册

数据挖掘在电子商务中的应用研究

来源:用户上传      作者: 刘其飞 胡宏涛

  摘要:本文主要介绍数据挖掘在电子商务中的应用,文章从数据挖掘的定义、数据挖掘的常用方法出发,阐述了数据挖掘在海量信息中提取有效信息的作用,特别是数据挖掘与电子商务的结合可以给人们生活带来便利,给企业带来新的利润空间以及为企业提供决策支持。常用的数据挖掘技术主要包括支持向量机、朴素贝叶斯、聚类、决策树、神经网络和关联规则等,最后介绍了数据挖掘在电子商务的4个主要应用方面,说明了数据挖掘存在的必要性。
  关键词:数据挖掘;电子商务;决策支持
  中图分类号:TP311.13文献标识码:A文章编号:1007-9599 (2012) 03-0000-02
  The Applications Study of Data Mining in E-commerce
  Liu Qifei, Hu Hongtao
  (Xi'an University of Petroleum, School of Computer Science, Xi'an 710065,China)
  Abstract: This paper introduces data mining in e-commerce applications, the article the definition of data mining, data mining commonly used method of departure, described the role of data mining to extract useful information in the mass of information, especially data mining and e-commerce combination can bring convenience to people's lives, to bring new business profit margins, and provide decision support for the enterprise. Commonly used data mining techniques including support vector machine, naive Bayes, clustering, decision trees, neural networks and association rules, etc. Finally, data mining in e-commerce, the four major applications, indicating the presence of data mining necessity.
  Keywords: Data mining;E-commerce;Decision support
  一、引言
  21世纪是电子商务的时代、电子商务以其低成本、便利、高回报等优点逐渐流行,被全球人们所接受。电子商务给人们生活带来了越来越多的便利。各行各行都在抓住电子商务这个潮流为企业创造更多的商机。Web数据挖掘是数据挖掘的一个重要分支,是随着数据库技术、人工智能技术和网络技术的发展而提出的。尤其是随着电子商务的不断运作,信息总量不断增加,更迫切需要有效的信息分析工具。在解决这些海量数据提取信息的问题过程中,科学家们于1989年提出了知识发现及数据挖掘。数据挖掘的核心技术历经了十几年的发展,已经取得了很大的成就,其中包括数理统计、人工智能、机器学习、神经网络、模式识别、数据库技术、知识获取和信息检索等。
  二、数据挖掘简介
  (一)数据挖掘定义
  数据挖掘是近年出现的一种全新信息技术,同时也是基于计算机科学与技术,尤其是网络技术的发展及普遍应用而提出的一个重要课题。数据挖掘(Date Mining)就是从大量的、不完全的、有噪声的、模糊的随机的实际应用数据中,提取隐含在其中的、人们事先不知道但又是潜在有用的并最终可理解的信息和知识的非平凡过程[1,2]。数据挖掘的知识表示为概念(Concepts),规则(Rules)、规律(Regularities)、模式(Patterns)等形式。使用数据挖掘的优势是它能帮助企业从海量的数据库中挖掘出对企业有用的信息,对企业的决策提供支持,帮助企业取得市场竞争的优势。
  (二)数据挖掘流程
  
  图1数据挖掘过程
  数据挖掘整个过程分为定义业务问题、数据理解、数据准备、数据挖掘、模型评估。这五个步骤是数据挖掘所必须的过程。
  1.定义业务问题。数据挖掘是从海量的数据中挖掘出对使用者有用的数据信息,它在数据挖掘中是第一个步骤,它也是比较重要的阶段。数据挖掘在电子商务中的应用例如,要做电信客户的流失分析,也就是找到哪些客户即将流失哪些不会流失,所以应该明确其任务主要是构建一个分类模型后对客户分类。
  2.数据理解。数据理解是对数据挖掘的业务问题的一个业务数据的抽象,是现实模型世界在计算机上的数据映像。数据理解包括明确模型的目标变量和输入变量。
  3.数据准备。数据准备是数据挖掘的必要环节,也是挖掘结果是否科学可用的关键一环。因为收集阶段得到的数据有些可能不准确。表现为数据可能存在不一致性,或有“脏”数据或者数据有缺失等,所以首先需要清洗数据;再根据业务分析的结果对数据进行整合与转化操作。
  4.数据挖掘。针对特定的需求来选择合适的算法,来进行挖掘。这是因为不同的方案产生的结果是不同的。
  5.模型评估。结果评价和表达这个步骤是在上面步骤得出的模式模型,有可能是没有实际意义或者是没有实际的使用价值,这需要对模型进行评判。
  (三)WEB数据挖掘
  Web数据挖掘是数据挖掘在WEB上的应用,它是一项综合的技术,涉及到数据库、WEB技术、计算机语言等多个学科领域,是一个综合且交叉性的学科,它包括计算机与数学的交叉。Web数据挖掘的发展是电子商务发展的必然产物。这是由于Internet/Intranet技术的发展,尤其是Web的全球普及,使得Web上的信息量无比丰富,越来越多的机构和个人在网络上发布信息、查找信息。Web上的数据是海量的,同时,Web是无结构的、动态的,Web页面极其复杂。这样就使得人们从成千上万的Web站点中找到有用的数据变得比较困难。于是,人们就越来越关注如何开发和利用Web上的数据资源。这些都需要WEB数据挖掘,这里给出一个WEB数据挖掘的定义:
  Web挖掘是指从大量的Web文档集合C隐含的P模式,如果C作为输入,为输出P,然后,Web挖掘过程是一个从输入到输出的映射:C→P[3]。 Web挖掘分为三类:内容挖掘,结构挖掘,挖掘应用。 Web内容挖掘是指发现网页上的内容信息,以找到具体的信息需要从文本,图像,音频,视频和其他形式的网络资源的“利息”。搜索引擎,智能代理和推荐引擎使用内容挖掘,以帮助客户找到所需的内容,在浩瀚的网络空间。 Web结构挖掘是挖掘Web链接结构模式的潜力,来自网络的组织结构和链接关系的信息和知识的过程。 Web应用程序的开采挖掘Web服务器日志来获取信息来预测用户的浏览行为,是指从用户的访问日志中挖掘用户访问模式。
  三、数据挖掘在电子商务中的应用
  数据挖掘是一种从数据集中提取那些隐藏在数据集中的有用数据的非平凡的过程[4]。目前数据挖掘已经在各个行业都得到了广泛的应用,也帮助企业获取到了一定的利润。对于当前电子商务的高度发展,毫无疑问电子商务是Web数据挖掘研究的重要发展方向之一。例如,它在电信、零售网购等商业领域都有着广泛的使用价值。目前数据挖掘在电子商务方面主要有以下几方面的应用。

  (一)获得潜在客户信息。随着服务行业的竞争加剧,以客户为中心的理念不断加强,客户是服务行业的主要目标,如何挖掘自身客户是每个企业都在考虑的问题。例如电信、联通这些运营商如何来获取客户信息,哪些客户喜欢用移动号码,哪些客户喜欢用联通号码,他们的年龄分布群是怎样的,收入状况如何。通过分析挖掘这些数据的潜在规律可以更好地帮助他们获取潜在的客户信息。当前以Web为主要销售模式的电子商务对Web信息的挖掘也能够保证企业挖掘潜在的客户信息。例如对于在客户访问的Web信息上进行挖掘,可以获取这些客户的信息。
  (二)挖掘客户潜在需求。分析客户、了解客户并引导客户的需求已成为企业经营的重要课题。电信业务收据收集了客户交易的所有信息,对客户进行分类,确定不同类型的用户不同的潜在行为,然后采取相应的营销策略,使企业产生利润最大化。
  (三)留住自己的客户。电信、移动、联通这些运营商如何能让客户成为自身的“忠实粉丝”不丢失客户也是他们必须考虑的一个问题。数据挖掘技术可以对大量的客户信息进行一个数据分类,把客户分成不同的类型,不同的客户类型具有不同的属性,企业可以根据不同的客户类型提供不同服务,让客户对企业产生很好的满意度,这样是留住客户的一个因素。数据挖掘技术还可以从这些数据中发现出来哪些特质的客户是有可能流失的,这样企业可以采取相应的措施对客户进行挽留。对应客户来说,销售商与客户之间的空间与时间的差距在电子商务上已经不存在。每一个销售团队与客户来说处于一个被选择状态,如何让客户来选择自己,在自己的电子商务网站或者是网店上停留更长的时间,对销售商来说是一个比较大的挑战性的任务,因为客户在你的电子商务网站上多停留一刻,你挽留住这位客户的可能性就大了一分。为了达到这个目的,企业销售商需要了解客户的浏览行为,了解客户的兴趣以及需求所在,动态的来提供不同的销售服务,来获取更大的客户满意度[5]。
  (四)聚类客户。聚类客户也是数据挖掘在电子商务应用一个重要方面。它是通过分析客户的浏览行为来分析客户所属的类别。提取客户的共同特征,可以有效的帮助产品销售商更好的了解自己的客户,向客户提供更加贴身的服务。例如,有些客户一直在买“婴儿衣服”,“尿不湿”这些产品,通过分析这个客户的浏览行为,我们可以将这个客户纳入“Parents”客户组,在下次该顾客光顾的时候相应就可以推荐“奶粉”,“玩具”等产品。对于他们所进行的业务活动当然不能等同于其它聚类如“大学生”,“白领太太”。销售商根据不同聚类客户提供不同的服务,使得商务活动能最大限度地满足客户需求,创造更多的利润。对于客户来说,更加便利的服务,更加优惠的价格,更短的时间是他们选择电子商务的动力之一。
  四、结束语
  电子商务是Web高度发展的产物,为我们提供了极为便利的商务解决方案,但是电子商务拥有海量的Web数据,如何将海量的电子商务的Web信息进行有效的组织利用,从中抽取感兴趣的数据,提供商业决策支持,提供商业模式,以便更好地理解客户的行为,就必须采用数据挖掘作为解决方案。如何改进站点结构为客户提供更多的个性化服务,已经在电子商务行业引起关注,数据挖掘对电子商务而言潜力是巨大的,从电信、金融行业的一个个现实应用都证明了数据挖掘对电子商务的应用价值和意义是非常巨大的。
  参考文献:
  [1]祁明等.电子商务实用教程[M].高等教育出版社,2004,4
  [2]邹显春等.电子商务与Web数据挖掘[J].计算机应用,2001,5
  [3]罗布.马蒂森.电信业客户流失管理[M].人民邮电出版社,2005,7
  [4]师江波,胡建华.基于数据挖掘的电信客户流失预测分析[J].山西电子技术,2009,1
  [5]朱德利.SQL Server 2005数据挖掘与商务智能完全解决方案[M].电子工业出版社,2007,10


转载注明来源:https://www.xzbu.com/8/view-1683616.htm