基于聚类算法对主站与电厂、变电站的数据同步问题的研究
来源:用户上传
作者:
摘 要:电网线路、变压器等设备已更新,而主站系统中的对应参数未及时更新和不同设备的量测数据的同步存在延迟,导致电厂、变电站端送到主站的电压、电流、功率等数据与主站本地对应端的量测数据之间存在严重的不平衡,本文通过聚类算法实现主站与电厂、变电站的数据同步问题,从而提高了数据质量。
关键词:聚类算法;变电站;数据同步;质量检查
0 引言
电网发现电压、电流、功率等不平衡时,主站调度员首先确认主站数据库中变比、拓扑等是否及时更新,相关通知报文是否处理。若主站数据库正常则调度员会联络电厂、变电站值班人员根据现场设备排查问题,查看是否是数据源问题或通讯问题。整个排查过程无自动化解决方案,需要多方协同手工实时联络排查,过程费时费力,急需自动化排查方案。具体表现为电厂、变电站端送到主站的电压、电流、功率等数据与主站本地对应端的量测数据之间存在严重的不平衡。有两个原因:线路、变压器等设备已更新,而主站系统中的对应参数未及时更新和不同设备的量测数据的同步存在延迟,本文通过聚类算法实现主站与电厂、变电站的数据同步,实现了数据质量的提高。
1 算法模型
1.1 算法原理
线路功率平衡计算:一条母线所有端流入流出的功率与损耗功率应当平衡。若发现功率平衡误差过大,结合报警信息,初步判断数据同步出现问题。以图1所示B2母线为例:
其中,PG2为发电机G2的有功功率输出,PT2为变压器T2的一次侧有功功率输入,PB2为母线B2的线路损耗。PB2一般远小于PG2与PT2,因此当PG2与PT2差距过大时,可能是数据同步出现问题。其它参数说明如下PLi为负荷,Bi为母线,Gi为发电机和Ti为变压器。
1.2 聚类算法
K-means[1,2]聚类算法是一种无监督机器学习算法,其过程首先随机选取K个对象目标定为初始的聚类中心,接着计算每一个对象和其它所有种子聚类中心相隔的距离,随后,每个对象分配给离它距离最近的聚类中心。聚类中心以及被分配的对象就代表一个聚类。如果每分配一个样本,聚类的中心位置会按照聚类中现有的对象进行重新计算。此过程将不断重复直到满足某个条件为止。终止条件设定为:没有对象被重新分配给不同的聚类,找不到聚类中心再发生变化,得出的误差平方和局部最小,具体步骤如下:
(1)首先确定一个k值,数据集将经过聚类得到k个集合。(2)从待选数据集中随机选择k个数据点作为质心。(3)针对数据集中每个点,算出其与每个质心的长度(如欧式距离),划分的原则遵循就近原则,离那个质心近,就划分到质心所属的集合。(4)如果所有数据被归好集合后,合计有k个集合,接着重新算出每个集合的质心。(5)如果刚刚计算出来的质心和已有质心之间的长度小于预先设置的阈值,就可以得出初步结论,聚类已经达到期望的结果,算法终止。(6)假如新质心和原质心长度范围变化很大,需要迭代第3、第4和第5步骤。
2 整体流程
首先开始主网本地数据稽核,并检查主网数据设备、台帐、表记资产等信息的完整性(包含设备编号、台帐类信息、表资产编号信息和设备最后修改时间戳信息),检查主网未处理的消息报文,提取未处理消息报文信息(时间信息、设备信息和参数修改信息),检查设备编号与修改信息真实性,参数修改信息是否真实,如果不真实,记录报文数据,数据驳回,要求发送设备编号更多信息以检验数据真实性,如果数据真实修改参数信息、记录修改报告;接着根据主网不平衡报警信息检查主网线路平衡问题,通过有功平衡、无功平衡、电压平衡和电流平衡四个指标筛选检查真实存在不平衡设备,并记录不平衡设备报警信息,使用K-Means聚类异常不平衡数据,随机生成聚类样本中心,修正聚类中心,计算样本间欧式距离重新聚类,如果样本簇发生改变,分析聚类中心样本异常数据特征,据此分类提升效率,根据变比错误、拓扑更新不及时和数据源问题判断是否完成,主网数据同步机制校验,如果完成校验[3,4]。记录不同步设备编号,出具主网数据不同步报告。
2.1 数据质量检查
设备台帐表资产信息检查是否完整,如果信息检查不完整,就判断是否多次不完整,如果不是多次信息检查不完整,就重新下载设备台帐表计资产信息检查;如果多次信息检查不完整,将数据驳回出具报告并要求整改。如果信息完整,出现不平衡告警,并判断是否有报文未处理、数据是否有时间戳、所有现场设备数据是否已经获得,如果没有获得,就判断是否多次无法获取完整数据,要求现场发送所有设备数据;如果上述3个条件都满足,就可以结束质量检查,进行数据真实性校验[5],数据质量检查关键步骤如下:
(1)检查台账信息是否完整;(2)出现不平衡告警时,检查是否有未处理的报文;(3)检查量测数据是否有时间戳;(4)检查现场发送的显示设备等设备的实时数据是否已完整。
2.2 數据校验
使用k-均值聚类方法将所有已知的告警点的数据分类,并依据电网经验,将每类异常数控(不平衡的有功数据)与实际错误数据(变比)建立对应关系,流程图2如下。
询问电网公司应将数据集划分为多少个簇,并随机分配k个异常数据向量作为初始簇质心位置[6],输入一条异常数据向量,并找到离其最近的簇质心,如果所有异常数据的中心已找到,输入一个簇,并找到簇的质心并更新;如果异常数据的中心没有找到,则返回初始簇质心位置。如果所有簇的质心已更新,则判断是否满足终止准则;如果所有簇的质心没有更新,则返回到异常数据中心。如果数值不满足终止准则,则返回到初始簇质心位置;如果满足终止条件,则输出所有簇质心,接着再输入一个簇质心,并依据电网公司经验赋值给一个对应的错误数据点;并判断所有簇与错误点的对应关系是否建立,如果没有建立,返回输出所有质心,如果建立,输出所有簇和对应关系。异常数据向量的构建方式如下:
2.3 数据修正和驳回
当告警出现时,寻找本条告警数据的最近簇中心,对应错误类别即可判别为此告警的错误类别,当数据不完整时或要求修改参数不匹配时将数据驳回,要求电厂与变电站发送更多参数已检查数据完整性与真实性。
3 结语
本文提出基于基于聚类算法对主站与电厂、变电站的数据同步问题的解决办法,从数据质量检查、数据校验、数据修正和数据驳回三个个步骤解决了主站与电厂、变电站的数据同步问题,使数据质量大大得到很大的改善。
参考文献
[1] 杨俊闯,赵超.K-Means聚类算法研究综述[J].计算机工程与应用,2019(23):7-14+63.
[2] 曾俊.基于划分的数据挖掘K-means聚类算法分析[J].现代电子技术,2020(3):14-17.
[3] 崔浩,许军,张小康,等.智能变电站的电子式互感器数据同步算法研究综述[J].电工电气,2018(7):1-9.
[4] 国网福建省电力有限公司检修分公司.变电站监控后台数据库、SCD及RCD的同步系统及方法:CN201910932554.8[P].2020-01-31.
[5] 张俊伟,沈祥.变电站自动化数据采样数字化同步技术的方法综述[J].数字化用户,2017(49):241.
[6] 殷培峰,张婧瑜.基于智能变电站数字化保护的采样数据同步技术应用[J].工业仪表与自动化装置,2017(5):63-66.
转载注明来源:https://www.xzbu.com/8/view-15265464.htm