基于案例推理的天猫店铺在线评论分析
来源:用户上传
作者:
摘 要: 在线评论是售后问题的文字化反映,分析其所包含的信息对售后问题的解决有重要意义。文中基于案例推理技术,应用NLPIR软件对Pathon软件获取的9家天猫店铺3 964条售后评论进行分析,通过信息挖掘获取关键词并建立案例库;引入向量空间模型思想进行售后评论与历史评论的相似度计算。通过分析发现,关键词词汇量过大会使词汇冗余从而造成问题分类模糊,而考虑穷举过程中词汇相同的次数会使问题分类变得更加准确。
关键词: 在线评论; 案例推理; 模型构建; 数据获取; 信息挖掘; 结果分析
中图分类号: TN911?34; F272.3 文獻标识码: A 文章编号: 1004?373X(2020)02?0057?03
Tmall shop online comment analysis based on case?based reasoning
ZHANG Yanliang, LI Xiaozhe
Abstract: Online comment is the literal reflection of the post?sales problems, in which the analysis of the comment information has great significance for the solution of after?sales problems. On the basis of the case?based reasoning technology, the 3 964 post?sales comments for 9 Tmall stores obtained with the Pathon software are analyzed with NLPIR software, and the keywords are obtained by means of information mining and the case library is built. The vector space model thought is introduced to perform the similarity calculation of after?sales comments and historical comments. It is found by analyzing that the excessive vocabulary of keywords can make the vocabulary redundant to cause the problem classification fuzzy, and considering the same number of words in the exhaustive process can make the problem classification more accurate.
Keywords: online comment; case?based reasoning; model construction; data acquisition; information mining; result analysis
0 引 言
网络购物过程中,在线评论数量、评论次数等因素影响消费者的购买决策[1]。商品的在线评论以其直观表达顾客感受的优点更容易获得潜在顾客的青睐[2]。潜在顾客根据在线评论对产品进行认知与感受,从而决定是否进行购买[3]。在线评论是使用者对产品的真实感受,对其进行处理是帮助顾客和商家从海量信息中找到有用信息的重要措施[4]。在线评论在表达顾客对产品感受的过程中,也表露了自身的情感倾向。毕建武等通过对在线评论的情感强度值进行分析,从而对商品进行排序,为消费者进行商品购买提供了建议[5]。在线评论的情感倾向的不同影响了消费者的购买决策,进而影响了产品的销量[6]。阮光册等指出商品的销量排名与反映产品本质的商品属性的情感极性存在着正相关关系[7]。从上述分析可以看出在线评论对消费者进行产品购买有着重要的影响作用。加大对在线评论的管理力度,消除负面在线评论是电子商务平台店铺关注的重点。
消除负面在线评论的主要方法是对在线评论中的差评进行关注,找出差评的原因并对自身进行改善[8]。基于此,本文对在线评论进行研究,引入向量空间模型思想,根据穷举策略对在线评论相似度进行计算,从而寻找类似案例的处理方案。在线评论的互动性可以帮助制造商了解顾客需求,从而获得启发,提升产品质量[9]。引入产品全生命周期思想,将问题反馈到相对应的阶段,通过提升服务的质量和产品的质量,最终提升顾客的满意度。
1 模型构建
1.1 基于产品全生命周期的售后评论案例库的构建
产品的全生命周期可以分为三个阶段,用[CB],[CM],[CE]表示产品需求分析阶段、产品生产阶段和产品售后服务阶段的问题类别集合,具体表述为:
[CB=CB1,CB2,…,CBn]
[CM=CM1,CM2,…,CMn]
[CE=CE1,CE2,…,CEn]
描述问题时,通常使用相关的关键词来表明该问题的种类,即:
[CBi=CBi1,CBi2,…,CBim]
[CMi=CMi1,CMi2,…,CMin] [CEi=CEi1,CEi2,…,CEik]
因此,构建案例库:
[C=CBiCBi1…CBimCMiCBi1…CBinCEiCEi1…CEik]
1.2 基于向量空间模型的案例相似度计算
利用NLPIR软件对顾客所反映的售后问题进行分词处理,确定不同种类售后问题所特有的关键词,并对这些关键词做词频统计。针对不同类别的售后问题的关键词的词频表示为[FBi=FBi1,FBi2,…,FBim],[FMi=FMi1,FMi2,…,FMin],[FEi=FEi1,FEi2,…,FEik],其中[FBi],[FMi],[FEi]分别表示[CBi],[CMi],[CEi]中对应的关键词的词频,则基于向量空间模型的关键词的权重计算公式(以关键词[CBi1]的权重计算为例)为:
[wBi1=FBi1j=1mFBij]
穷举策略是对相似度进行计算的一種有效方法,将句子进行分词处理,并将分词后的词汇分别与关键词进行对比,若句中词汇[xi]与关键词[CBij](以[CBi]中的关键词为例)相同,则[wi(xi,CBij)=wBij],否则[wi=0]。如果评论在与文档中的词汇进行对比的过程中,该评论中有较多的词汇出现在该文档中,那么说明该评论与该篇文档有较大的相关度,为了避免词汇量对于词汇权重的影响,应该在计算句子与文档之间的相似度的过程中加入对比相同词汇量的指标,记为[ni]。句子与历史售后评论之间的相似度计算公式表示为:
[Sim(Sen,d)=nii=1nwi]
2 实证分析
服饰作为必需品,需求越多,产生的问题相对较多,因此本文根据上衣、裤子、鞋子随机选取九家店铺数据。利用Pathon软件获取所选取的天猫店铺的评价数据,并对获取的售后评论进行如下分类:尺寸、厚薄程度、颜色和舒适度。其中有关尺寸的在线评论有2 888条,厚薄程度的有639条,颜色的为306条,有关舒适度的评论有131条。
2.1 词频统计
利用NLPIR软件对收集的数据进行分词处理,尺寸、厚薄程度、颜色和舒适度的词汇分别有682,490,426,82条,部分统计结果(以部分尺寸词频统计为例)如表1所示。
2.2 关键词获取
对获得的词汇进行分析,以尺寸词汇为例。表1中类似于“非常”的副词,并不含有实际的意义,应进行剔除。“码子偏小一点”“尺码有点偏小”再提取“码子小”“尺码小”,并分别将处理后的结果在“码子”“尺码”“小”上增加12,4,16。另外“买”“一”“好”等与相关的主题不相关的词汇也应当予以去除。同理,以此筛选规则分别对薄厚程度、颜色、舒适度进行词汇的处理,最终处理的结果如表2所示。
2.3 案例分析
1) 关键词有效性验证
选择4条天猫店铺中评论语句, “薄点,号码小点,建议亲们买的时候拍大一号”“料子很硬,不是软的,但是很舒服,透气一般,没见掉色”“掉色很严重 味道也难闻 物流还慢 同样是2尺3的黑的就可以穿 灰的就穿不了 说是有运费险还不是我自己掏的钱 也没有给我返支付宝 什么意思也懒的问 就当花钱买教训了”“买给他的,这件他还挺喜欢的,178,50 kg左右,拍的码大了,换了165刚刚好,面料也不错,薄薄的,比另外一件一百多的好”,记为Sen1,Sen2,Sen3,Sen4。为了验证关键词的有效性,利用本文提取的关键词、全部词汇和根据文献[10]选取排序前20%的词汇组成的关键词分别对4条评论进行相似度计算,并只进行对比相一致的词汇的权重的相加。计算结果如表3所示。
从上述计算可以看出,本文提取的关键词对于相关度不大的问题不会产生相似度值,而相关度大的问题相似度值更高,说明选取的关键词可以对问题种类进行更有力的区别。因此本文选取的关键词对问题的刻画有着一定的准确性、快速性及有效性。
2) 基于向量空间模型的相似度计算
由以上分析可知该选取关键词的规则具有一定的有效性,但是最高的两个相似度相差却很小,不易对在线评论进行分类,本文考虑句子与案例库关键词间词汇相一致的次数。根据本文提出基于向量空间模型的相似度计算方法对Sen1,Sen2,Sen3,Sen4进行相似度计算,结果如表4所示。
根据上述计算结果将Sen1,Sen2,Sen3,Sen4分别归类到尺寸、舒适度、颜色和尺寸。Sen1,Sen2,Sen3,Sen4与尺寸、舒适度、颜色和尺寸的关键词相一致的词汇分别为“号码、小、大、号”“硬、透气、料子”“掉色、黑”“码、大”。从上述售后评论中的重要词汇可以看出对应的商品的问题分别是尺码不符、料子硬、掉色和尺码偏大四种,商家可以根据以往对这类问题的解决方案对新产生的售后问题进行相应的处理。同时Sen1,Sen2,Sen3,Sen4四个评论反映了产品全生命周期的设计阶段中尺码设计不标准、材料选取、染色工艺选取等问题,店铺将涉及的产品进行反馈可以促进产品质量的提升。
3 结 论
本文以在线评论为研究对象,文中引入产品全生命周期和向量空间模型对案例库进行构建及相似度计算,通过实例验证得到如下结论:将全生命周期的思想引入案例推理中,更有利于对案例库进行分类及产品问题的解决,引入向量空间模型思想,使相似度计算变得更加简便,并减少了人工参与;在进行相似度计算的过程中,句子词汇与关键词相同的次数越多说明该句子与该案例库的相关程度越大;进行分词后,去除所得的分词中的词汇冗余有利于更迅速地将问题进行分类,并且分类的结果更具有说服力;词汇量过大有可能会淹没问题与案例库的相似度,导致相似度较低不易判断问题的种类。
参考文献
[1] 李宗伟,张艳辉,栾东庆.哪些因素影响消费者的在线购买决策:顾客感知价值的驱动作用[J].管理评论,2017,29(8):136?146.
[2] 张倩,郭晓林.在线商品评论对制造商收益的影响研究[J].商业经济研究,2016(11):72?74.
[3] 汪旭晖,张其林,杜航.在线顾客评论对产品销量的影响:品牌强度和产品成熟度的调节作用[J].管理工程学报,2018,32(3):9?18.
[4] 聂卉.隐主题模型下产品评论观点的凝聚与量化[J].情报学报,2017,36(6):565?573.
[5] 毕建武,刘洋,樊治平.依据在线评论的商品排序方法[J].系统工程学报,2018,33(3):422?432.
[6] 石文华,王璐,绳娜,等.在线初次评论与在线追加评论对商品销量影响的比较研究[J].管理评论,2018,30(1):144?153.
[7] 阮光册,周健超.商品属性的情感表达与商品销售热度的相关性研究[J].图书情报工作,2017,61(22):13?19.
[8] 林洁,王平春.电子商务贸易中在线评论有用性影响因素研究[J].商业经济研究,2017(10):73?75.
[9] 张倩,郭晓林.在线商品评论对制造商收益的影响研究[J].商业经济研究,2016(11):72?74.
[10] 李琦,赵辉.中文报纸中的水土保持新闻特点[J].水土保持通报,2017,37(5):213?217.
作者简介:张炎亮(1979—),女,安徽人,副教授,主要研究方向为质量管理、质量控制、服务质量等。
李小哲(1993—),男,河南人,硕士研究生,主要研究方向为工业工程、电子商务、服务质量等。
转载注明来源:https://www.xzbu.com/8/view-15122059.htm