您好, 访客   登录/注册

基于K均值聚类和混合核函数相关向量机的变压器故障诊断方法

来源:用户上传      作者:汤三 武红玉

  【摘  要】油中溶解气体分析是电力变压器故障诊断中常用的方法,论文提出了一种基于K均值聚类和混合核函数相关向量机的变压器故障诊断方法。论文首先对样本进行K均值聚类,然后再利用相关向量机的二叉树结构进行分类划分,相关向量机的核函数采用高斯核函数和二项式核函数混合组合的方法。实验结果表明,相比于三比值法、BP神经网络算法,论文所提方法具有较高的变压器故障诊断正确率。
  【Abstract】Dissolved gas analysis in oil is a common method in power transformer fault diagnosis. This paper proposes a power transformer fault diagnosis method based on K-means clustering and relevance vector machine with the optimized combined kernel function. Firstly, the paper clusters the samples with K-means, and then uses the binary tree architecture of the relevance vector machine to classify and divide. The kernel function of the relevance vector machine adopts the method of combining Gaussian kernel function and polynomial kernel function. The experimental results show that, compared with the three-ratio method and BP neural network algorithm, the method proposed in the paper has a high accuracy rate of power transformer fault diagnosis.
  【关键词】故障诊断;相关向量机;电力变压器;K均值聚类
  【Keywords】fault diagnosis; relevance vector machine; power transformer; K-means clustering
  【中图分类号】TM407                               【文献标志码】A                                   【文章编号】1673-1069(2020)07-0165-03
  1 引言
  电力变压器是电力系统中不可缺少的重要设备,在电力系统安全运行中具有非常重要的作用。变压器在设计上虽然具有良好的机械性能和足够的电气强度,但其自身结构比较复杂,所处工作环境较为复杂、恶劣,在长期运行过程中可能出现过热、过流等非正常状态,造成绝缘老化、材料劣化,进而引发故障和事故。因此,对变压器进行故障诊断研究,及时发现变压器潜伏性故障,对电力系统运行的稳定性和可靠性具有非常重要的意义。
  变压器油中溶解气体的含量和气体含量的比值可在不同的方面反映变压器的运行状态[1],油中溶解气体分析DGA(Dissolved Gas Analysis)方法成为油浸式变压器故障诊断的一种有效方法,传统的IEC三比值法、Rogers法[2]等正是在此基础上形成的。随着计算机技术和人工智能的快速发展,人工神经网络、支持向量机等人工智能方法在变压器故障诊断中得到不断应用。
  相关向量机(relevance vector machine,RVM)是基于稀疏贝叶斯理论的一种新型机器学习算法,具有需要训练样本少、泛化能力强等优点。朱永利等[3]第一次将相关向量机应用于变压器故障诊断,随后基于各种改进的相关向量机的诊断变压器故障方法不断出现。尹金良等[4]将代价敏感机制引入多分类相关向量机应用于变压器故障诊断,克服其诊断方法未考虑误诊代价差异性的问题。陈嘉霖等[5]提出了将邻域粗糙集与相关向量机相结合的变压器故障综合诊断模型,以提升相关向量机的实用性和准确性。袁海满等[6]利用粒子群优化算法对相关向量机的核函数参数进行优化,以提高变压器的故障诊断精度。各种算法和相关向量机的结合,可以有效提高变压器故障诊断正确率和诊断精度。
  本文将K均值聚类和相关向量机结合的方法构造变压器故障诊断模型。首先通过K均值聚类方法得到各个类的聚类中心,然后根据层次划分,利用各个聚类中心构造一棵二叉树,利用聚类中心重新形成训练样本集,进而训练二叉树各个节点处的相关向量机分类器,采用混合核函数对测试样本进行测试,最后得到变压器故障诊断模型。
  2 方法理论概述
  2.1 K均值聚类算法
  K均值聚类算法是基于距离的硬聚类算法。对于给定数据集:
  X={xi│xi ∈Rm, i=1,2,…,n}       (1)
  其中,n為样本个数,m为样本维数,样本集的类别空间:
  μ={μj│μj ∈Rm, j=1,2,…,c}           (2)   c为类别数。两个样本点的距离采用欧式距离进行度量,即:
  D(xi,xj)=             (3)
  聚类中心为μk=
  式中,n表示属于第k类的样本个数。
  K均值算法的目标是达到簇内样本距离最小化,簇间样本距离最大化,因此,其目标函数为:
  min= D(xi,μj)                      (4)
  K均值算法的流程如图1所示。
  2.2 相关向量机算法
  2.2.1 相关向量机算法
  相关向量机是一种用于回归和分类的贝叶斯稀疏算法,对于二分类问题,给定训练样本集{X,T},其中X=(xi)为输入量,T=(ti)为目标向量,T∈(0,1)且。输入样本X和目标值t直接的关系表示为:p(ti),其中,噪声εi服从高斯分布:εi~N(0,?滓2),其均值为0,方差为?滓2[7]。
  相关向量机的分类模型如下:
  y(x,ω)= ωiK(x,xi)+ω0    (5)
  式中,分类模型权值ω=[ω1,ω2,…,ωn],K(x,xi)为相关向量机的核函数。由于假设目标值ti独立,因此,整个数据集的似然函数为:
  p(ti│ω,σ2)=N( Φω,σ2)      (6)
  其中,φ是由核函数组成的结构矩阵:
  Φ=[φ(x1),φ(x2),…,φ(xn)]T
  Φ的每行表达式为φ(xn)=[1,K(xi,x1),…,K(xn,xN)]T。若直接用最大似然法求解ω和σ2,通常会导致ω中的大部分元素不为0,导致过学习。为避免过学习的出现,定义权重的ARD先验概率分布:
  其中,a=(a0,a1,…,aN)是由超参数组成的向量,假定超参数a与噪声参数σ2均服从Gamma先验概率分布,则求解权重ω的问题转化为求解超参数a,当a趋于无穷大时,ω趋向0。
  2.2.2 相关向量机分类器核函数选取
  在相关向量机算法中,核函数的选取和核参数的设置对分类性能带来特别重要的影响。变压器的故障样本数据包含多种不同的特征信息,在分类的过程中若RVM采用单一的核函数会降低分类的精度和准确度。本文采用付华等[8]提出的核函数选取方法,将高斯核函数和二项式核函数按权系数p结合,该方法可以融合多种特征信息,克服了单一核函数预测精度低的缺点。核函数公式如式(8)所示。
  Kpoly=[(xiyj)+1]2KRBF=exp(-‖xi-yj‖2/2K=pKpoly+(1-p)KRBFσ2      (8)
  式中,p为核函数权系数,0≤p≤1,p=0或者p=1时分别为单一核函数;Kpoly为二项式核函数;KRBF为高斯核函数;σ为核函数的宽度。
  3 多分类相关向量机模型
  变压器故障诊断是一个多分类的问题,而RVM本质上是二分类算法,因此,文中建立多分类模型,采用多个RVM分类器实现变压器的故障诊断。本文采用二叉树分类思想[9],把变压器故障的多分類模型不断分解成一系列的两分类组合问题,最后使所有的分类都细化划分到只有一个类别,其中任意两个子类的划分采用RVM分类器。
  文中通过K均值聚类算法得到各个类的聚类中心,进而根据变压器故障类别进行层次划分,利用各个聚类中心构造一棵二叉树。在二叉树的每个节点处,相当于有一个RVM分类器。根据所得的聚类中心重新形成训练样本集。最后利用新的样本集训练二叉树各个节点处的RVM分类器,采用上节所述的混合核函数相关向量机,最终得到基于二叉树的混合核函数相关向量机分类器模型。
  4 变压器故障诊断方法
  变压器处于不正常状态工作时,变压器油的气体含量会大幅增加,通常选取油中产生的H2、CH4、C2H2、C2H4、C2H6这五种特征气体作为参考变量。依据收集的实际故障样本,在对变压器故障类型特点分析的基础上,将变压器的运行状态分为正常状态(N)和低能放电(D1)、高能放电(D2)、中低温过热(T12)、高温过热(T3)四种故障状态。
  基于二叉树的混合核函数相关向量机的变压器故障诊断流程图如图2所示。
  5 实验结果及分析
  本文从相关文献中选用已确定实际故障的355组DGA数据进行验证,根据数据实际情况分为正常状态(N)、低能放电(D1)、高能放电(D2)、中低温过热(T12)、高温过热(T3)五种状态。将样本数据大约按1:1分组,如表1所示。
  表1  训练及测试样本数据
  ①利用K均值聚类算法,分别对训练样本五种状态进行聚类,得到各自的聚类中心,Y={y1,y2,y3,y4,y5},分别和N、D1、D2、T12、T3对应,如表2所示。
  表2  五种状态训练样本各自所对应的聚类中心
  ②利用K均值聚类将Y={y1,y2,y3,y4,y5}聚类为两类,Yn={y1}和Yf={y2,y3,y4,y5},同理,将Yf聚类为两类,Yd={y2,y3}和Yt={y4,y5},以此类推,分别对Yd和Yt进行聚类,最终形成二叉树,如图3所示。
  ③根据建立的二叉树模型,将训练样本逐层分解,在树的各个节点处,重新组织分解到的相应训练样本,训练对应的相关向量机分类器,保存训练优化得到的各个相关向量机参数,进而建立基于二叉树的混合核函数相关向量机的变压器故障诊断模型。   为了验证本文方法的有效性,将本文算法与三比值法、BP神经网络方法的变压器故障诊断进行对比分析。BP神经网络算法输入层神经元为5,隐层神经元数为15,输出层神经元为5。表3给出了三比值法、BP神经网络算法和本文算法的变压器故障诊断正判率及对比情况。
  表3  故障诊断结果对比
  对表3分析可知,与三比值法、基于BP神经网络算法的变压器故障诊断方法相比,本文所提方法具有较高的故障诊断正确率。
  6 结论
  本文提出了一种基于K均值聚类和混合核函数相关向量机的变压器故障诊断方法,该模型采用二叉树方式建立RVM的二分类方法。通过对测试样本集的实验对比,验证了本文算法的有效性,与三比值法及基于BP神经网络算法对比,本文算法明显提高了变压器故障诊断的正确率。
  【参考文献】
  【1】操敦奎.变压器油色谱分析与故障诊断[M].北京:中国电力出版社,2010.
  【2】张德明.变压器分接开关状态监测与故障诊断[M].北京:中国电力出版社,2008.
  【3】朱永利,尹金良.组合核相关向量机在电力变压器故障诊断中的应用研究[J].中国电机工程学报,2013,33(20):68-74.
  【4】尹金良,刘玲玲.代价敏感相关向量机的研究及其在变压器故障诊断中的应用[J].電力自动化设备,2014,34(5):111-115.
  【5】陈嘉霖,段家华,张明宇.邻域粗糙集与相关向量机相结合的变压器故障综合诊断模型[J].电力系统及其自动化学报,2016,28(011):117-122.
  【6】袁海满,雷帆,陈宇,等.基于DGA的粒子群相关向量机变压器故障诊断[J].高压电器,2017,53(2):108-112.
  【7】李强,皮智谋.基于独立分量分析和相关向量机的轴承故障诊断研究[J].制造业自动化,2014,36(8):6-9.
  【8】付华,任仁.基于组合核相关向量机和量子粒子群优化算法的变压器故障诊断方法[J].2017,53(10):131-135.
  【9】吴恩英,吕佳.基于二叉树支持向量机多类分类算法的研究[J].重庆师范大学学报(自然科学版),2016,33(3):102-105.
转载注明来源:https://www.xzbu.com/4/view-15369903.htm