您好, 访客   登录/注册

基于支持向量机的电力系统短期负荷的组合预测

来源:用户上传      作者:

  [摘 要]本文通过实例详细的说明支持向量机与K-means++算法结合用于电力系统短期负荷预测,并与单一的支持向量机算法进行综合比较,验证此种组合预测方案的优越性。
  [关键词]K-means++;支持向量机;负荷预测;组合预测
  中图分类号:TP301.6 文献标识码:A 文章编号:1009-914X(2019)11-0396-02
  Combined forecasting of short-term load in power system based on support vector machine
  [Abstract]In this paper, an example is given to illustrate the combination of SVM and K-means++ algorithm in short-term load forecasting of power system. Compared with single SVM algorithm, the superiority of this combination forecasting scheme is verified.
  [Keywords]K-means++; support vector machine; Load forecasting; Combinatorial prediction
  1 引言
  電力系统负荷预测是指从负荷本身的变化情况及经济、环境等因素的影响规律出发,通过对历史数据的分析和研究,发现事物之间的内在联系和发展变化规律,以未来的经济、环境等因素发展趋势作为依据,对电力需求作出预先的估计和推测。由上世纪60年代以来,对于电力系统的短期负荷预测,国外内学者提出了大量的方法,并引用于实践中,但是都存在一定的弊端,因为此前采用的都是一些单一预测的方法,近年来组合预测方法的提出,才使得负荷预测的取得了长足的进步。在此基础上,本文提出了一种基于支持向量机与K-means++算法的组合预测新方法。
  2 支持向量机
  支持向量机是Corinna Cortes和 Vapnik等于1995年[42]首先提出的,是一种监督式学习的方法,广泛应用于统计分类以及回归分析中[43]。按照算法目的支持向量机可以分为分类与回归,即SVC和SVR,按处理的对象又可以分为线性可分和非线性可分,对于非线性可分数据就是在线性可分的数据的基础上,增加一个核函数,将原数据映射到高维的空间,然后在新的空间分离超平面,进行样本的划分或者预测,下面将简要介绍支持向量机如何对两种数据进行划分。
  (1)线性可分数据:若存在一个线性函数能够将两类数据样本完全分开,则称这些样本是线性可分的,但是并不只存在一条能够将两类数据完全分开的一条直线,而最大超平面只有一个,最大超平面是最适合分开两类数据的直线,即这条直线离直线两边的数据间隔最大,根据分离超平面的定义,可以得出超平面所对应的模型如下
  其中, 是权重向量,即,决定了超平面的方向; 是属性数; 是标量,为位移项,决定了超平面与原点之间的距离, 为样本空间任意点。
  (2)非线性可分数据:就是线性可分数据的反面,即找不到一个超平面能够将训练样本正确分类。对于这样的问题,在支持向量机有一个核函数的概念,就是将用非线性映射将原输入数据变换到较高维的空间,然后在新的空间搜索分离超平面,利用线性SVM公式求解,这样就在新的空间中找到最大边缘超平面对应于原空间中的非线性的分离超曲面,而这个映射关系就是核函数。由此,可以得出这类问题的数学模型,
  (2)
  其中, 为核函数,实际中常采用高斯核函数。
  3 用于实例
  本文选用的是斯洛伐克东部电力公司于2001年8月1日全球举办的负荷预测竞赛提供的数据,该公司给出了1997年、1998年以及1999年1月份每天每隔30分钟的电荷量,将1997年和1998年的电荷数据作为训练样本(共730份数据),1999年1月份的电荷量视为未知量(共31份数据),以此来进行1999年一月份的日最大电荷的预测。
  将通过数据预处理的样本数据,结合历史资料分析的一些对负荷预测影响的因素,将数据分为训练集和测试集,并选取因变量和自变量。本文是预测1999年1月份的日最大负荷量,考虑到负荷的日、周、月、年周期属性,和温度与节假日情况的关系,则本文选取的样本的输入量共24个特征依次为:
  为使所有数据在同一区间内,本文将数据进行标准化再进行建模与预测。具体的负荷预测流程图如图1所示。
  从上图可以看出,基于支持向量机的电力系统短期负荷预测的结果还是可以用于实际中的,具有实用性的。本文在此基础上提出了将K-means++算法与支持向量机一起使用的组合预测方法对电力系统短期负荷进行预测。
  4组合预测
  本文提出了一种K-mean与SVM算法组合的电力系统短期负荷预测的新方法。这种方法是在支持向量机的预测基础上增加了一个聚类的过程,即将与待预测样本特征相似的训练样本筛选出来作为新的训练样本,进行负荷预测。这种方法理论是可行的,因为它减少了训练样本的噪声,只存在与待预测样本具有相似特征的样本,不仅提高了预测精确度还提高了预测的效率,减少了计算量。
  K-means++算法是由K-means算法改进而来的,也是基于距离的非层次聚类算法。该算法首先选取n个样品作为初始的聚类中心,在此基础上选取的第n+1个聚类中心要尽可能远离那初始的n个聚类中心然后以距离评价样本之间的相似程度,即相似程度高的样本之间的距离小,相似程度低的样本之间的距离大,距离聚类中心小的样本相互聚集,就形成了以初始聚类中心聚集的初始聚类,最后判断得到的聚类结果是否符合聚类要求,如果不符合则重复以上操作,选取新的聚类中心,直到最终的聚类结果满足要求。   具体的算法过程如下。
  (1)假设有一点构成的集合 ,从集合 中随机选取一个点 作为初始的第一个聚类中心;
  (2)以欧式距离计算 中每个 与其最近的聚类中心的距离为 ,欧式距离公式为:
  (3)將所有的 求和,得到 ;
  (4)随机取一个 区间内的值 ,用 减去所有 ,直到存在一个满足式 的 时,此 即为新的一个聚类中心;
  (5)重复步骤2-4,直到选出的我们事先设定的K个聚类中心为止。
  根据此算法,以轮廓系数作为判定聚类效果好坏的标准,经过多次验证,本文取K=3时的聚类效果最好,即将训练样本分为3类,并标记1、2、3,并以此规则同样将待预测分为3类,并标记1、2、3,只选择与待预测样本特征相似的训练样本进行训练,接下来的步骤与支持向量机预测一致。则组合预测的流程图如图3所示。
  预测结果,如图4所示。
  从上图可以看出,组合预测的曲线比单一的支持向量机的预测曲线更加拟合真实曲线,因此说明K-means++算法与支持向量机组合的预测效果要强于单一的支持向量机。
  5 结论
  电力系统的负荷预测是电力部门的重要工作之一,是电力系统经济调度、实时控制、运行计划和发展规划的前提,影响到发电、输电和电能分配等方面的合理安排。对于负荷预测的研究,已经有几十年的历史,存在很多的负荷预测的理论和方法。随着科学理论与技术的发展,对于负荷预测的研究也在不断发展,本文证明组合预测的方法要比单一预测方法的预测精度高,效果好,各种组合预测会越来越多的用于负荷预测中。
  参考文献
  [1] 张良均,王路,谭立云等.Python数据分析与挖掘实战[M].北京:机械工业出版社,2015:89-93
  [2] 数据挖掘:概念与技术[M].范明,孟小峰译.北京:机械工业出版社,2012:213-221
  [3] 数据挖掘:实用机器学习工具与技术[M].李川,张永辉等译.北京:机械工业出版社,2014:2-6
  [4]清华大学电机系.电力市场需求预测理论及其应用[M].北京:清华大学,1997
  [5]康重庆,夏清等. 电力系统负荷预测的综合模型[J]. 自然科学报,1
转载注明来源:https://www.xzbu.com/1/view-15334596.htm