您好, 访客   登录/注册

基于模糊聚类算法对网店规范化管理的探究

来源:用户上传      作者: 张春龙 马 赛

  [摘要] 随着科技的发展信息技术的普及,网店、网上购物已经成为人们生活的一部分。据统计,2008年我国参加网上购物的人数已经达到3亿。电子商务的发展已成为一种历史潮流,但也正是随着电子商务的兴起,网络交易中的不规范行为急剧增多。本文首先介绍电子商务中存在的一些问题,再对这些问题进行分析,之后介绍模糊聚类算法的一种并给出基于聚类算法的网络监管的方法。最后,根据真实数据对算法进行仿真测试。
  [关键词] 模糊聚类 网店管理 版权保护 传递闭包
  
  一、引言
  
  1.电子商务的迅猛发展
  随着网络的普及科技的发展,一些新的词汇诸如网店、淘宝等,出现自我们的生活中并成为了我们生活的一部分。从接触互联网的人数上来看,截止2009年6月30日,中国互联网有效受众规模达3.51亿,比2008年的3.03亿增长15.8%;从网购人均消费金额来看,全国城镇居民去年人均收入14140元,网购人均金额1080元;从市场规模来看,2009年,据中国互联网数据中心调查显示,中国B2C电子商务市场规模高达52.2亿元,较上一年增长了33.5%。从这些数据中,我们可以清楚看出,由于网店方便快捷、交易迅速、打理方便、形式多样、价格低廉的优点,它正在逐步成为更多人生活的一部分。不可否认网络购物已成为历史发展的必然,在中国它有着美好的发展前景。
  
  二、网店的不规范问题
  
  1.网店有美好的发展前景,但网店也存在着很多不规范的问题
  网上购物是一个新兴的有强烈发展势头的市场,但是在网络销售过程中却存在很多不规范的行为。2009年,中国友谊出版公司因为淘宝销售盗版书把淘宝告上了法庭。实际上这只是网店销售不规范行为的冰上一角,你可以在淘宝上输入一款你熟悉的商品,你会发现,同样的商品价格竟然可以相差几倍甚至几十倍,这说明了什么?答案显而易见中国的很多网店已成为盗版,伪劣商品,走私商品销售的平台了。中国友谊出版公司诉淘宝网销售盗版书一案,最终二审法院判定,作为交易平台的淘宝网不需要承担任何责任。这表明作为第三方的服务平台的提供者,对类似的盗版销售不承担任何责任。第三方服务平台没责任,出版社权益被侵害,仅仅网店被封,真能从根本上解决网络销售中的不规范行为吗?答案是显然的不能。伴随着电子商务在我国蓬勃发展,我们应该找寻更有效的方法对其进行监管。马云也曾发表声明说,未来电子商务的发展必须解决规范化问题。由此可见,电子商务发展的规范化将是电子商务未来发展的重点。
  
  2.电子商务现有的机制
  买家在网上买东西的大致流程如下:
  (1)买家在网上搜索商品,找到自己所需商品以及商品所在网店
  (2)利用支付宝购买商品,购买费用先支付给第三方
  (3)当收到商品后,检查商品,查看是不是符合自己要求的商品
  (4)如果相符并且满意,通知第三方把钱支付给卖家;如果不相符,要求退货,第三方不会把购买费用支付给卖家
  (5)买家对卖家提供服务的细节进行打分,并可以对已买商品发表自己的评论
  (6)卖家再对买家打分
  这种评价体系和支付体系,可以保证用户不至于“人财两空”,用户可以通过退货来向第三方平台索回支付的金额。同时,用户在购买商品时,也可以通过看别人的评价和描述,还有对应买家的信誉来选择是否购买。这两个机制是网上购物发展的基础。它们推动了电子商务的发展,但是这种评价体系和支付体系中实际存在一个不可忽视的漏洞。当卖家销售盗版的、或是由偷盗得来的商品,买家收到价格低廉的商品觉得很好,于是买卖双方都会很高兴,既不会有投诉,也不会影响卖家信誉。但这种行为大大侵害了合法经营者的权益。这是电子商务发展必须解决的一个不规范问题。诸如此类的问题其实还有很多。
  
  3.对网店管理的分析
  网店之所以难于管理主要是因为网络上各式各样的网店种类太多,无法形成统一的管理制度,无法用单一方法进行监管。行业的不同导致网店的多样性,即便是相同的行业销售新的商品和销售二手商品的网店也不相同。网络上销售衣服与销售移动充值卡的店不能用统一的管理制度管理,更不能用一种方法进行监管。即便是在同一行业,销售二手书的书店和销售非二手书的书店也不相同。
  聚类分析的思想是根据特定的聚类算法对多样的事物进行分类。如果能把网店系统的分类,并且对各式各样的网店采取分类监管,这将大大减少监管成本和提高监管效率。行业的划分,比较简单,这个可以仅凭它们销售的商品判断,同一行业不同种网店的划分将是下面讨论的重点。
  
  三、模糊聚类算法
  
  1.聚类算法简介
  聚类分析是由若干模式组成的,通常模式是一个度量的向量,或者是多维空间中的一个点。聚类分析以相似性为基础,在一个聚类中的模式之间比不在同一聚类中的模式之间具有更多的相似性。聚类算法用途很广泛。例如:在数据库应用中,作为一个模块,它可以作为一个单独的工具来挖掘数据库中分布的一些深层潜在的信息,并且概括出聚类的特点,或者把注意力放在某一个特定的类上来作进一步的分析和研究;在数据挖掘方面,聚类分析也可以作为数据挖掘算法中其他分析算法的一个预处理步骤,简化数据挖掘过程。聚类分析的算法可以分为划分法、层次法、基于密度的方法、基于网格的方法、基于模型的方法。在商业上,聚类可以帮助市场分析人员从客户关系数据库中区分出不同的客户类,并且概括出每一类客户的消费模式或者说习惯。聚类算法中的k-means算法、k-medoids算法、clara算法、clarans算法已被很多人研究和应用于实际生产和工作之中。
  
  2.模糊聚类算法的思想和具体过程
  (1)建立模糊相似矩阵
  设样本集合X={x1,x2,x3……xn } ,n是样本数目,每个样xi有一组特征数据(xi1,xi2,xi3……xim),通过xi这些的特征值算出相似系数,即Xi与Xj的相似程度,建立模糊相似矩阵R。在相似系数计算中使用绝对值减法进行计算,具体公式如下:
  
  其中 ,0≤c≤1,适当的取c值使在0到1的闭区间里。
  (2)计算传递闭包:
  传递闭包 :对之前处理过的模糊相似矩阵R,依次用平方法计算,R2,R4,R2t,…,当第一次出现Rk○Rk=Rk时,则称Rk=(tij)为传递闭包。(○为模糊乘法)在传递闭包t(R)=(tij)中,0≤t≤1(i,j=1,2,…,n)。用此原则计算,得到传递闭包的矩阵。
  (3)输入λ值,进行聚类:
  令λ为tij中某一值(从高到低取值)。使得Rλ=(λij ) 其中:当tij ≥ λ,λij =1其它λij =0。根据矩阵竖排0和1的情况对x1,x2,x3……xn进行归类。0和1完全相同的竖着的一列为一类。
  
  四、仿真试验
  
  随机在淘宝上收集的一系列书的价格数据如下:
   A B C D E F G H I J
  1 28.7 175 95 76.7 155 24.3 18.8 20 36 39
  2 15.8 17.8 17.8 26 45 18 11 13.6 15 22.8
  3 12 15 21 28 42.8 21 9.8 14.8 15 16.8
  4 35 148 100 118 190.65 21.6 20 21 39 50.4
  5 31 76 88 85 181 24.3 19 15 32.37 24

  6 24.5 60 40 62 162.8 21.6 18.8 16.7 29.25 43.5
  7 25 16.99 26.99 69 120 27 19.8 17 29 42.3
  8 25.5 52 42.8 35 153.75 24 19 18.9 29.25 39.5
  9 26.5 48 68 39.22 159 23.5 19.8 16 32 22.99
  10 30 60.8 39 82 175 24 21 20 30 52.2
  备注:A B C D 分别代表不同的书 1 2 3 4 等别代表不同的卖书网店具体书名如下:
  A:词以类记张红岩
  B:TOEFLOG 第二版
  C:DELTA---新托福考试备考策略与模拟试题
  D:巴朗---新托福考试备考策略与模拟试题
  E:GMAT OG 第十二版
  F:GMT数学分册
  G:GMAT词汇精选
  H:GMAT数学
  I: GMAT 语法全解 白勇
  J:GMAT 逻辑全解 陈向东
  第一步,输入网店图书价格数据,得到的结果:
  
  第二步,利用绝对值减数进行相似矩阵计算,所得结果如下:
  
  第三步,计算传递闭包,所得结果如下:
  
  第四步,最终结果:
  当入=0.78时,R0.7 = 1001111111
   0000000000
   0000000000
   1001111111
   1001111111
  1001111111
  1001111111
  1001111111
   1001111111
  1001111111
  x1 x2 x3 x4 x5 x6 x7 x8 x9 x10
  分析数据:由R矩阵可以得到{2、3}商铺是一类 {1、4、5、6、7、8、9、10}商铺是一类,可以对{2、3}{1、4、5、6、7、8、9、10}进行不同的监管,这样的监管更具有针对性并且可以提高监管效率。
  本次试验由于数据较少,我们可以从表格直接可以看出,店铺2、3所列书的价格远远低于其他店铺,可以通过简单对照,知道本算法是有效的。本算法也可有效的应用在大量网店分类中。
  
  五、总结
  
  随着电子商务在中国迅猛的发展,电子商务曝露出了许多自身的问题,网上盗版书的销售、伪劣产品的销售等。如果能对网店进行恰当的分类,并且分类地进行管理,那么会更有利于网店规范化的运作。运用模糊聚类算法可以恰当的对其进行分类。具体过程:首先对数据进行绝对值减数计算,求出相似矩阵,再对其进行传递闭包计算,最后根据λ值进行分类。算法实施过程中应用MATLAB软件计算方便快捷,便于操作和使用。如果能将其广泛的运用于网店管理上,可以在很大程度上减少网店监管成本和提高监管效率。
  
  参考文献:
  [1]罗承忠:模糊集引论[M].北京:北京师范大学出版社,2005:105―111
  [2]陈新泉:特征加权的模糊C聚类算法[J].计算机工程与设计, 2007,28(22):5328-5333
  [3]李爱国:一种基于属性加权模糊聚类算法[J].常熟理工学院学报,2007,21(8):104-107


转载注明来源:https://www.xzbu.com/3/view-1478782.htm