您好, 访客   登录/注册

聚类分析在话务量预测中的应用

来源:用户上传      作者: 司亮 张校伟

  摘 要 介绍了聚类分析在话务量预测中样本数据预处理的应用,采用K-Means快速聚类分析方法对话务量的样本数据进行检测,剔除奇异样本,预测准确度有了明显改善,减小了奇异样本对预测准确度的影响。
  关键词 聚类分析;话务量;预测
  中图分类号TN91 文献标识码A 文章编号 1674-6708(2014)119-0220-01
  0引言
  聚类分析是把数据按照相似性归纳成若干类别,同一类中的数据彼此相似,不同类中的数据相异。聚类分析可以建立宏观的概念,发现数据的分布模式,以及可能的数据属性之间的相互关系。聚类分析在市场分析、医药卫生、社会学、经济学等众多领域得到了应用,本文探讨聚类分析的方法在移动通信网话务量预测中的应用。
  1奇异样本检测及话务预测
  在话务预测的实践中,一般采集过往一段时期A口的月均系统忙时话务进行未来一定时期的预测分析,话务的增减趋势、周期波动等信息隐藏在大量的A口数据中,通常某些时段的数据偏离月均值较大,这与网络维护、数据采集、用户行为均有关系,我们称这些数据为奇异样本,奇异样本不能反应A口月均系统忙时话务量的实际走势,从而引起预测值产生偏差。通过采集某地区一年的日系统忙时话务量发现,不同月份中,A口日系统忙时话务量的离散程度不同,某些值偏离中心值较大。
  使用聚类分析的方法,可以将每月的A口日系统忙时话务量进行样本分类,将每月的奇异点找到并剔除。本文采用K-Means聚类方法,对每月(28~31个样本点)逐一分为两类,将其中数目较小的类别(3个以下样本)作为奇异点剔除。下表为一月份31天的日系统忙时话务量分类结果,可以看出,1类样本2个(25号、26号),2类样本29个,其中25、26号两天的数据被有效的分类出来,作为奇异点剔除。
  依据上述方法将全年12个月的数据逐一分类,剔除奇异点。采用灰色预测的方法对月均系统忙时进行拟合,预测次年头三个月话务量,结果如下所示:在样本区间内,采用聚类分析剔除奇异点后的拟合程度优于剔除前(剔除后仅有4个点拟合值与实际值绝对差值大于剔除前),在预测区间内,采用聚类分析剔除奇异点后,1、2月份的预测值更接近实际值。
  2结论
  采用聚类分析方法对话务量的样本数据进行检测,能够有效的区分出奇异样本,剔除异常样本后预测准确度有了明显改善,减小了奇异样本对预测准确度的影响。在话务分析大数据处理背景下,聚类分析能够快速有效的剔除奇异样本。
  参考文献
  [1]陈平雁,黄浙明.SPSS10.0统计软件应用教程.人民军医出版社.
  [2]王学盟.灰色系统方法简明教程.成都科技大学出版社.
转载注明来源:https://www.xzbu.com/8/view-6128628.htm