聚类分析在话务量预测中的应用

> 中国论文网 >
科技论文 >
聚类分析在话务量预测中的应用

聚类分析在话务量预测中的应用

来源:用户上传作者: 司亮张校伟

　　摘要介绍了聚类分析在话务量预测中样本数据预处理的应用，采用K-Means快速聚类分析方法对话务量的样本数据进行检测，剔除奇异样本，预测准确度有了明显改善，减小了奇异样本对预测准确度的影响。
　　关键词聚类分析；话务量；预测
　　中图分类号TN91 文献标识码A 文章编号 1674-6708（2014）119-0220-01
　　0引言
　　聚类分析是把数据按照相似性归纳成若干类别，同一类中的数据彼此相似，不同类中的数据相异。聚类分析可以建立宏观的概念，发现数据的分布模式，以及可能的数据属性之间的相互关系。聚类分析在市场分析、医药卫生、社会学、经济学等众多领域得到了应用，本文探讨聚类分析的方法在移动通信网话务量预测中的应用。
　　1奇异样本检测及话务预测
　　在话务预测的实践中，一般采集过往一段时期A口的月均系统忙时话务进行未来一定时期的预测分析，话务的增减趋势、周期波动等信息隐藏在大量的A口数据中，通常某些时段的数据偏离月均值较大，这与网络维护、数据采集、用户行为均有关系，我们称这些数据为奇异样本，奇异样本不能反应A口月均系统忙时话务量的实际走势，从而引起预测值产生偏差。通过采集某地区一年的日系统忙时话务量发现，不同月份中，A口日系统忙时话务量的离散程度不同，某些值偏离中心值较大。
　　使用聚类分析的方法，可以将每月的A口日系统忙时话务量进行样本分类，将每月的奇异点找到并剔除。本文采用K-Means聚类方法，对每月（28～31个样本点）逐一分为两类，将其中数目较小的类别（3个以下样本）作为奇异点剔除。下表为一月份31天的日系统忙时话务量分类结果，可以看出，1类样本2个（25号、26号），2类样本29个，其中25、26号两天的数据被有效的分类出来，作为奇异点剔除。
　　依据上述方法将全年12个月的数据逐一分类，剔除奇异点。采用灰色预测的方法对月均系统忙时进行拟合，预测次年头三个月话务量，结果如下所示：在样本区间内，采用聚类分析剔除奇异点后的拟合程度优于剔除前（剔除后仅有4个点拟合值与实际值绝对差值大于剔除前），在预测区间内，采用聚类分析剔除奇异点后，1、2月份的预测值更接近实际值。
　　2结论
　　采用聚类分析方法对话务量的样本数据进行检测，能够有效的区分出奇异样本，剔除异常样本后预测准确度有了明显改善，减小了奇异样本对预测准确度的影响。在话务分析大数据处理背景下，聚类分析能够快速有效的剔除奇异样本。
　　参考文献
　　[1]陈平雁，黄浙明.SPSS10.0统计软件应用教程.人民军医出版社.
　　[2]王学盟.灰色系统方法简明教程.成都科技大学出版社.
转载注明来源:https://www.xzbu.com/8/view-6128628.htm

查看更多→

聚类分析在话务量预测中的应用

相关文章