基于稠密度聚类法和层次分析法(AHP)的窃电嫌疑行为检测
来源:用户上传
作者:周江
摘 要:本文针对目前对窃电行为早期快速诊断和发现困难的现状,提出了一种在基于大数据背景下的稠密度聚类法和层次分析法(AHP),通过先对用电用户的用电特征进行聚类,然后对具有窃电嫌疑特征的分类进行层次分析法,最终给出各用电用户的窃电嫌疑程度指数,以帮助实际用电稽查和反窃电工作。
关键词:窃电嫌疑 稠密度聚类 层次分析法(AHP)
中图分类号:F27 文献标识码:A 文章編号:1674-098X(2020)02(a)-0085-02
大数据分析技术的快速发展,解决了海量数据分析的技术问题。国际上已有很多利用大数据在不同场景与需求下进行准确检测与判断的研究。在用户窃电检测方面,国网的用户用电信息采集系统已经实现了对电力用户的全覆盖、全采集,所得到的海量的、完备的用户数据,完全能满足大数据分析使用需求。
1 稠密度聚类法和层次分析法
1.1 稠密度聚类法
1.1.1 聚类法原理
聚类分析是研究(样品或指标)分类问题的一种统计分析方法,以相似性为基础,在一个聚类中的模式之间比不在同一聚类中的模式之间具有更多的相似性。从某一程度来看也可理解它是一种基于传统的贴标签功能和依托IT技术进行聚类分析而成的用户画像应用技术。
用户用电是有规律可循的,作为用户用电记录的负荷曲线也应该是有规律可循的。一般情况,可把用户用电分为生活用电、办公用电和生产用电三种。生活用电特点:一是电量小;二是任何一天,任何时间都可能发生。根据生活用电的这些特点,生活用电在日分布图上,往往是一条连续的,波动不大的,低矮的曲线。我们常常把生活用电生成的这条曲线叫做底层用电(以下简称底层)。办公用电特点:一是电量比生活用电电量大;二是按作息时间用电;三是常常加班用电。机关事业单位没有生产用电,办公用电就是该用户的用电顶层(以下简称顶层)。工业企业单位办公用电覆盖了生活用电,形成高底。生产用电特点:一是用电量最大;二是遵守作息时间;三是有鲜明的行业特点。生产用电构成日分布的顶层,从顶层形状可以推断用户作息时间和行业特点。一般情况,以上三种类型用电使用同一块电表,24h连续计量,因各个用户作息时间不同,用电类型不同,所以生成形象各异的负荷曲线分布图:上班时间记录用电的顶层;下班时间记录底层;加班底层是高底。对于全天工作的机关事业单位,顶层是办公电流;对于全天工作的工业企业单位,生产用电是顶层。以上的分析就是电流分布规律的要点。
1.1.2 分析步骤
电流日分布规律很大程度跟用户行业有关,不同行业的用电规律在电流日分布规律图中表现差异较大,故利用电流日分布规律数据样本量还无法足以对所有用电用户进行细致地聚类分析。如要进行分析,则需要利用到电流月分布规律图,这也体现了聚类分析的基础是来源于电力大数据的概念。
根据电流月分布规律数据分析,我们梳理并可以聚类为七种类型的用电用户,它们是:平稳型、波动型、渐变型、跳变型、局部0型、全部0型、局部露底型。
1.1.3 分析特征归纳
通过以上的分析过程阐述,我们基本可以得出初步结论:平稳型、波动型、渐变型三种为正常分布;跳变型、局部0、全部0、局部露底4种为异常分布。但造成异常分布的原因我们不能断定就是用户的窃电行为。通过电流稠度的聚类分析方法,我们完全根据单一类型的历史数据来对所有用电用户进行了一次归类画像,从而快速圈定用电行为异常用户的范围。如要对这些用户进行再次精确分析和贴上量化的标贴,就需要采取下一步的层次分析法了。
1.2 层次分析法
1.2.1 算法原理
层次分析法(Analytic Hierarchy Process,简称AHP)是将与决策总是有关的元素分解成目标、准则、方案等层次,在此基础之上进行定性和定量分析的决策方法。在窃电嫌疑分析应用中,将不同的用户当作不同的备选方案,线损平衡指标、功率平衡指标、失压、短相、缺相、失流等电表事件、负载率特征、作业习惯、功率因数分布、功率历史数据特征作为第一层次要素,用电平衡指标、表计事件、历史数据特征,作为第二层次元素。分别赋予不同的权重比例,最终通过加权递阶归并,得到每个用户的窃电嫌疑指数。
1.2.2 分析步骤
(1)划分层次。
根据层次分析原理分层建立用电异常指标体系,指标层从上至下分别为:O={用户用电异常嫌疑指数},A={平衡分析,表计事件分析、历史数据分析},以及包含各单项指标的B层,按照指标对用户用电异常嫌疑指数的影响,指标值越高,用电异常嫌疑就越大。
(2)权重设置。
设置B层指标对于综合用电异常指数权重。W=[w1,w2,w3,…,w17]。
(3)计算窃电嫌疑指数。
设由 层次分析法指标对于总目标的层次总排序权重为W=[w1,w2,…,wn],各指标状态值为S=[s1,s2,…,sn],先得到A层指标。
由于a1对应的下层指标为b1,b2,则a1的综合指标的计算方法为:
Va=W1*S1+W2*S2
S为B层指标对应的状态指标值W为各指标对应的权重系数。
则最后综合分值为:
通过对B层指标的分体及加权计算可以得到A层指标的具体指标值,通过对A层指标值进行累加可以得到用电异常综合评估指标,指标值越大,用电异常嫌疑就越大。
2 结语
本文提出了一种在大数据背景下运用并结合稠密度聚类分析法和层次分析法来检测用电行为异常嫌疑程度的方法。选取电力用户的用电特征数据,通过纵向历史大数据和单一电流特征规律来归类用户和辨识异常用电用户群体,以此来启动进一步的层次分析法,并且同时又作为层次分析法中的一个重要层次指数。通过这两种方法,快速给出有不同程度系数的窃电嫌疑用户清单,以供供电企业进行用电稽查和反窃电工作的重要依据。
本文提出的分析数据只需要来源于既有的用电信息采集系统中即可,跟常用的硬件判断法、其他软件分析方法相比,本方法不依赖加装现场硬件设备,也不需要在软件系统中补录和丰富其他数据。利用现有的数据可同时用于分析当前的和过去的窃电行为。实际应用表明该方法具有很好的用电异常行为分析、发现能力,可以作为发现窃电行为检测重要手段,具有很好实用价值。
参考文献
[1] 袁小林.窃电现象剖析与反窃电对策[A].第十一届全国防治窃电工作交流大会[C].2011.
[2] 李静.利用电力负荷管理系统实时监测电量窃漏[A].中国城市供电学术年会[C].2005.
[3] 韩颖.窃电网络特征分析及其判定方法[D].华北电力大学,2008.
[4] 韩家炜.数据挖掘:概念与技术[M].北京:机械工业出版社,2007.
转载注明来源:https://www.xzbu.com/1/view-15215574.htm