基于深度聚类的居民用户电力负载模式识别
来源:用户上传
作者:吴青筱 王合宁 仇浩宇 结艺�E 董骏峰
摘 要:电力用户负载模式的识别有利于引导用户参与需求侧管理,提高能源的利用效率。面对电力负荷数据日趋海量的情况,传统K-Means算法无法有效处理,且存在无法准确衡量高维电力数据距离、对噪声和异常数据敏感等问题,文章提出一种基于自编码器(auto-encoder, AE)与K-Means算法结合的方法。首先利用自编码器来提取出电力数据潜在的特征,然后利用K-Means算法对提取出的抽象特征进行聚类,最后利用自编码器与聚类的联合误差优化整个模型,使聚类效果更好。通过英国电力网络领导的低碳项目中伦敦家庭的电力数据集来验证方法效果,证明该方法能提供准确的聚类结果,有效分析出不同类型的负载模式。
关键词:负载模式识别;自编码器;K-Means算法;数据集;深度聚类
中图分类号:TM714 文献标志码:A 文章编号:2095-2945(2022)24-0029-06
Abstract: The identification of power user load pattern is helpful to guide users to participate in demand side management and improve the efficiency of energy utilization. In the face of the increasing amount of power load data, the traditional K-Means algorithm has no effective processing method, and there are some problems, such as unable to accurately measure the distance of high-dimensional power data, sensitive to noise and abnormal data, this paper proposes a method based on the combination of auto-encoder (AE) and K-Means algorithm. Firstly, the potential features of power data are extracted by auto-encoder, and then the extracted abstract features are clustered by K-Means algorithm. Finally, the joint error of auto-encoder and clustering is used to optimize the whole model to make the clustering effect better. The effectiveness of the method is verified by the power data set of London households in the low-carbon project led by the British power network. It is proved that the method can provide accurate clustering results and effectively analyze different types of load patterns.
Keywords: load pattern recognition; auto-encoder; K-Means algorithm; the data set; the depth of the clustering
在电力物联网的背景下,智能电表广泛应用于住宅小区,配备了测量和通信能力,能够记录细粒度的能源消耗的客户和提供额外的信息给公用事业公司[1]。通过挖掘智能电表记录的海量电力负载数据,识别住宅居民电力负载模式,可以帮助制定科学合理的机制,引导用户积极参与需求响应[2]。另外,对于电力公司来说,了解用户如何以及何时用电也是至关重要的[3]。因此,对住宅居民用电负载模式的研究具有十分重要的应用价值。
负载模式识别的核心是聚类,目前的研究以K均值聚类算法(K-Means)、层次聚类、谱聚类等浅层的聚类方法为主。利用基于密度改进的K-Means算法来探究典型的用户用电模式[4],通过密度法和指标解决聚类数目的选择问题和局部最优问题。提出利用改进的K-Means算法,通过余弦距离定义和描述不同的电力用户群体,当聚类的数量太多而无法解释时,通过层次聚类以使用适当的距离度量M行另一次聚类[5]。提出了一种改进的层次聚类算法,比较了基于数据划分的层次聚类和传统层次聚类以及划分聚类算法的不同,通过聚类的评价指标和时间来验证聚类效果[6]。提出一种基于优化特征向量选取的遗传谱聚类算法,对算法中特征向量的提取过程进行了合理优化,防止数据信息缺失带来的影响[7]。
随着电力负载数据维度的不断增加,直接利用K-Means、谱聚类和层次聚类等浅层的聚类进行负载模式识别变得越来越困难,高维负载数据的内在特征被忽视。在这种维度高、深度特征越来越重要的情况下,利用深度神经网络进行聚类的方法有很好的应用效果。提出了一种基于生成性对抗网络的场景生成方法,对负载的不确定性和变化进行建模,训练后的网络模型会生成以日类型、温度和历史负荷为条件的剩余情景[8]。利用深度卷积神经网络首先从大规模负荷曲线中提取特征,然后,通过支持向量机识别电力用户的特征[9]。
本文提出了一种深度自编码器和K-Means结合的方法,利用自编码器对负载数据进行特征提取,提取负荷时序数据的内在特征。另外,考虑到聚类的本质为数据之间的距离性,聚类层的误差将参与到自编码器的参数更新中,联合优化自编码器和聚类层,进一步改善特征提取效果,从而能够获得更加准确的聚类结果,实现住宅用户的负载模式识别。
nlc202209082042
转载注明来源:https://www.xzbu.com/1/view-15439467.htm