数据挖掘技术在电子商务中的应用研究
来源:用户上传
作者: 杨青杰 胡明霞
[摘要] 电子商务在现代商务活动中的正变得日趋重要,而商务数据的处理则凸显出数据挖掘的重要。本文讨论了数据挖掘的主要方法,具体阐述了数据挖掘技术在电子商务中的作用及应用。
[关键词] 数据挖掘 电子商务 数据库
一、概述
数据挖掘(Data Mining)起源于数据库中的知识发现(Knowledge Discover in Database,KDD),是指从大型数据库或数据仓库中提取隐含的、未知的、非平凡且最终可理解的及有潜在应用价值的信息或模式。数据挖掘技术是计算机技术发展的热点之一。通过对历史积累的大量数据的有效挖掘,可以发现隐藏的规律或模式,为决策提供支持,而这些规律或模式是不能够依靠简单的数据查询得到,或者是不能在可接受的时间内得到。这些规律或模式可以进一步在专业人员的识别下成为知识,并可以应用到以客户为中心的企业决策分析和管理的各个不同领域和阶段。
电子商务(E-Commerce)是以指利用电子数据交换(Electronic Data Interchange,EDI)、电子邮件(E-mail)、电子资金转账(Electronic Funds Transfer,EFT)和Internet等主要技术在个人、企业和国家之间进行无纸化的信息交换,包括商品信息及其订购信息、资金信息及其支付信息、安全及其认证信息等,即以现代信息技术为手段,以经济效益为中心的现代化商业运转模式。其最终目标是实现商务活动的网络化、自动化与智能化。
随着Internet的迅速发展,电子商务的应用不断深入。在电子商务应用系统中,相关的用户数据日益增多,数据挖掘技术具有从大量复杂数据中发现特定规律的能力。商业电子化的趋势不仅为客户提供了便利的交易方式和广泛的选择,同时也为商家提供了更加深入了解客户需求信息和购物行为特征的可能性。
二、数据挖掘的主要方法
数据挖掘融合了数据库、人工智能、机器学习、统计学等多个领域的理论和技术。比较典型的数据挖掘方法有分类、关联规则分析、聚类分析和孤立点分析等。
1.分类。分类是找出一个类别的概念描述,它代表了这类数据的整体信息,即该类的内涵描述,一般用规则或决策树模式表示。实际上就是通过分析示例数据库中的数据,为每个类别做出准确的描述或建立分析模型或挖掘出分类规则,然后用这个分类规则对其他数据库中的记录进行分类。
2.关联规则分析。关联规则分析用于发现关联规则。若两个或多个数据项的取值重复出现且概率很高时,它就存在着某种关联,可以建立起这些数据项的关联规则,一般用“支持度”和“置信度”两个闽值来淘汰那些无用的关联规则。关联规则分析能发现数据库中诸如“90%的顾客在一次购买活动中购买商品A的同时购买商品B”之类的特征。
3.聚类分析。聚类分析的对象是一组未分类记录,并且这些记录应分成几类事先也不知道。聚类就是通过分析数据库中的记录数据,根据一定的分类规则,合理地划分记录集合,确定每个记录所在类别。它所采用的分类规则是由聚类分析工具决定的。采用不同的聚类方法,对于相同的记录集合可能有不同的划分结果。
4.孤立点分析。数据库中的数据常有一些异常记录,这些记录称为孤立点,常常包括很多潜在的知识,如分类中的反常实例、不满足规则的特例、观测结果与模型预测值的偏差、量值随时间的变化等。孤立点分析基本方法是寻找观测结果与参照之间的差别。
三、据据挖掘在的应用
数据挖掘的应用十分广泛,如银行、电信、保险、交通、零售(如超级市场)等领域。数据挖掘所能解决的典型商业问题包括数据库营销(Database Marketing)、客户群体划分(Customer Segmentation & Classification)、背景分析(Profile Analysis)、交叉销售(Cross-selling)等市场分析行为,以及客户流失性分析(Churn Analysis)、客户信用记分(Credit Scoring)和欺诈发现(Fraud Detection)等。
分类的目的是构造一个分类函数或分类模型,通常称作分类器。分类器的构造方法通常由统计方法、机器学习方法、神经网络方法等。在金融领域,管理者可以通过对客户偿还能力以及信用的分析,进行分类,评出等级,减少放贷的盲目性,提高资金的使用效率。
在零售业,数据挖掘可有助于识别顾客购买行为,发现顾客购买模式和趋势,改进服务质量,取得更好的顾客保持力和满意程度,提高货品销量比率,设计更好的货品运输与分销策略,减少商业成本。
电信、计算机网络、因特网和各种其它方式的通信和计算的融合是目前的大势所趋。利用数据挖掘技术来帮助理解商业行为、确定电信模式、捕捉盗用行为、更好的利用资源和提高服务质量是非常有必要的,通过挖掘进行盗用模式分析和异常模式识别,从而可尽早发现盗用,为公司减少损失。
数据挖掘是一个非常复杂的过程。每一种数据挖掘技术方法都有其自身的特点和实现步骤。每种数据挖掘的技术方法对输入/输出数据形式的要求、结构、参数设置、训练、测试和模型评价方式各自有不同的要求,算法应用领域的含义和能力也存在差异。数据挖掘过程一般分为定义问题、准备数据、实施挖掘、评价与表示等几个阶段。数据挖掘过程的这几个阶段都需要人的参与指导。
四、结束语
数据挖掘是指按企业既定业务目标,对大量的企业数据进行探索和分析,揭示隐藏的、未知的或验证已知的规律性,并进一步将其模型化的先进有效的方法。电子商务是现代信息技术发展的必然结果,也是未来商业运作模式的必然选择。企业数据量日益庞大,其中真正有价值的信息却很少,利用数据挖掘技术,从大量的数据中经过深层分析,获得有利于商业运作、提高竞争力的信息,发挥企业的独特优势,促进管理创新和技术创新。
参考文献:
[1]邓鲲鹏周延杰严瑜筱:数据挖掘与电子商务.商场现代化,2007(9S)
[2]袁柱:电子商务中Web数据挖掘的应用研究.商场现代化,2007(8S)
[3]周亮:面向电子商务的数据挖掘系统的研究与设计[D].武汉理工大学,2005
转载注明来源:https://www.xzbu.com/3/view-1490932.htm