一种基于支持向量机的客户满意度评价方法
来源:用户上传
作者: 郑先越 刘志焘
[摘要] 目前激烈的市场竞争环境迫使企业越来越多的关注客户的需求,因此客户满意度这一衡量客户对企业感知的评价指标就变得日益重要。本文提出了一种基于支持向量机的客户满意度评价方法,并且给出了一个客户满意度评价实例。实验结果表明,相对常用的人工神经网络BP算法,该方法提高了客户满意度分析的精度,能够帮助决策者更准确地了解客户对公司的评价,为客户关系管理的实施提供了良好的支持。
[关键词] 客户关系管理支持向量机客户满意度人工神经网络
一、引言
在当今竞争激烈的社会里,对客户关系进行有效的管理已成为全球范围内业界研究的热点。客户关系管理就是对客户信息进行分析处理并做出决策的过程,而客户满意度是做出正确决策和有效措施的基础。目前已有学者运用模糊层次分析方法,人工神经网络,未确知理论,四分图法对客户满意度进行研究。支持向量机(SVM)是Vapnik等人提出的一种新的机器学习方法,建立在统计学理论的VC理论和结构风险最小原理基础上,它能较好地解决小样本、非线性、高维数和局部极小点等实际问题,并成功运用于分类和时间预测等方面。本文正是基于以上理论,研究SVM在客户满意度评价中的应用,以期进一步提高客户关系管理的科学性。
二、客户关系管理及客户满意度
1.客户关系管理
随着信息时代的来临和世界经济一体化的发展,市场日趋成熟,人民的生活水平也日渐提高,原先以产品为导向的企业经营模式已经逐渐不能满足消费者多样化、个性化消费的需求。与此同时,顾客获取市场的信息变得越来越容易,其消费行为也更加成熟,企业由此面临的挑战日益增长。残酷的商业现状迫使企业从“以产品为核心”转变为“以客户为中心”,于是面对掌控企业经营命脉的顾客群体,客户关系管理自然而然地成为了企业的生存之本。
由全球最著名的IT分析公司Gartner Group提出的客户关系管理是一种全新的商业理念,其核心思想是以客户为中心,对客户进行系统化研究,以改进客户服务水平,它的最终目标是提高客户满意度和忠诚度,留住老客户,不断争取新客户和新商机,为企业带来更多的利润。目前,关于CRM 的理解,普遍这样认为:它是企业与客户进行交互的循环流程, 进而产生、收集和分析客户数据, 然后企业把结果应用到企业的服务和市场活动中 。由此看来,CRM与数据挖掘领域联系很大,而SVM作为数据挖掘技术中的一个重要方法,在客户关系管理中理应有很广泛的应用。
2.客户满意度
客户满意是顾客对其要求已被满足的感受,而客户满意度就是对客户满意水平的量化数据指标,反映的是客户满意状况,目标即在于将客户满意这一主观感知进行量化,以能够客观地说明客户满意水平。尤其在现今“以客户为中心”的市场背景下,客户满意度这一衡量客户对企业感知的评价指标就变得日益重要。它已成为评价一个企业经营管理水平的重要指标,也是企业成败的关键因素,成为管理者非常重视的一个经营指标。
三、SVM基本原理
SVM是从线性可分情况下的最优分类超平面发展而来的。对两类分类问题,设训练样本集为(xi,yi),i=1,2……,n,n为训练样本的个数,xi∈Rd为训练样本,yi∈{1,-1}是输入样本xi的类标记(期望输出)。SVM算法的出发点是寻找最优分类超平面。最优分类超平面不但能将所有样本正确分开(训练错分率为0),而且能够使两类间的边际(margin)最大,边际定义为训练数据集到该分类超平面的最小距离之和。最优分类超平面意味着对测试数据平均分类误差最小。
若样本集线性可分,d维空间中线性判别函数g(x)=ω・x+b,分类面方程为ω・x+b=0。将判别函数归一化,使离分类面最近样本的|g(x)|=1。若分类面对所有样本都能够正确分类,则满足:
yi(ω・x1+b)≥1,i=1,2……,n (1)分类超平面H0∶ω・x1+b=0为最优当且仅当(ω,b)是下面优化问题的解:
用Lagrange乘子法解上述QP问题,等价于解对偶问题:(2)
对每个训练样本xi,都有一个Lagrange乘子αi。解αi>0所对应的xi称为支持向量,它满足式(1)中的等式约束。支持向量距最优超平面最近,通常只是全体样本中的很少一部分,是对分割两类非常重要的样本点。
若αi为最优解,则(3)所以得到的分类决策函数为:(4)
其中x为待分类样本,SV为支持向量集,b*为分类阈值,可用任一支持向量求得。
四、客户满意度评价方法的实现
1.客户满意度评价指标体系
产品客户满意度评价指标是用来衡量某一产品满意度的项目因子或属性。为了说明情况,本文采用以下评价指标体系,认为客户满意度受以下7个因素影响,如表1所示。
2.客户满意度评价方法算法描述
客户满意度评价系统的学习样本是由属性集组成的,其决策是根据输入属性制定的。系统首先利用ReliefF方法对训练集样本进行约减,分辨出重要度较小的样本属性,将其从输入属性集中约减,从而获得了由最少属性构成的训练集样本。然后将样本输入SVM进行预测。算法如下:
Step 1:输入样本数据,用ReliefF方法对训练集样本V进行约简,分辨出重要度较小的样本属性,将其从输入属性集中约减,从而获得了由最少属性构成的训练集样本V`;
Step 2:将V`输入SVM,输出模型M,M=SVM(V`);
Step 3:输入测试数据Vt,输出预测结果向量Decision,计算正确率Accuracy=SVM(Vt,M)。
五、实例分析
本文的数据均来自于苏州某电子有限公司,满意度影响因素a-g分别对应于客户满意度评价指标体系的七类指标,h表示客户满意度。数据实验软件为WEKA。
实验用的数据集共100个样本,限于篇幅,文中只列出前10个训练样本数据,如表2所示。
我们使用10折交叉验证的方法,比较支持向量机和人工神经网络方法在客户满意度评价中的效果。支持向量机的算法采用SMOreg。人工神经网络算法采用多层感知器。支持向量机和人工神经网络的参数通过反复实验调整至最优。预测误差分别见表3和表4。
对比表3和表4可知,相对人工神经网络,使用支持向量机的方法来量化客户满意度的精度更高。
在对客户满意度评价时,不同指标对评价结果的影响是不一样的。这里我们使用ReliefF方法,对指标的重要性排序。
实验结果显示,在客户满意度评价中,g(服务准则)和e(价格感知)的影响最大,而f(企业形象)和b(及时性)则最低。根据专家建议,贡献最小的评价指标不会对决策产生显著影响。为了降低客户满意度评价方法的复杂度,同时提高其精度,因此我们不妨将属性f和b约减。从训练样本中去掉f和b对应的数据维,将约简后的样本数据输入WEKA,再次用支持向量机进行训练。训练结果如表7所示。
对比表3和表6可见,在进行属性约简后,基于支持向量机的客户满意度评价方法的性能指标都有了一定程度的提高。
六、总结与展望
本文尝试了使用支持向量机方法对客户满意度进行预测。从预测结果可以看出,该方法较之传统的人工神经网络方法更具优势,该方法在训练过程中,所需时间短,避免了过学习和欠学习的现象,且收敛与全局最优,具有很强的推广能力。
转载注明来源:https://www.xzbu.com/3/view-1505826.htm