您好, 访客   登录/注册

数据挖掘技术在电力企业大数据的应用

来源:用户上传      作者:

  摘要:新世纪下,电力企业在日常经营管理中,每天都会产生大量的数据信息,如输变电设备管理、运行、检修、电网维护等方面的数据。面临如此纷繁复杂的多维大数据集,电力企业常常很难迅速找到需要的有效信息。所以,应积极引进数据挖掘专业技术,来从这些海量的数据集当中,便捷地提取要用到的资料,并加以分析和处理。基于此,本文从电力企业出发,主要探讨了数据挖掘专业技术在大数据方面的应用,仅供参考。
  关键词:大数据;电力企业;数据挖掘
  中图分类号:TP311.13 文献标识码:A 文章编号:1007-9416(2020)09-0051-03
  在大数据时代下,电力企业获得了长足的发展,其中大数据起到的作用也越来越重要[1]。从电力企业角度来看,通过数据挖掘专业技术可以从各种电力大数据中,及时挖掘得到利用价值高的数据信息,不以此为基础来提供给电力企业重要的决策、规划、发展参考依据。
  1 数据挖掘概述
  1.1 基本流程
  (1)商业分析理解。立足商业角度,从商业基础目标着手,全面了解电力业务诉求及其终极目标,再有机结合业务诉求和电力数据挖掘和其结果。(2)数据分析理解。针对电力业务当中形成的真实数据,根据业务场景和诉求,统一评估、选取分析。(3)准备好数据。针对电力业务中,原始的有用数据,根据业务模型,积极组织、清洗,以满足建模方面的要求。(4)规范建模。通过联合诸多种建模技术,来规范校准电力业务数据及建模参数。具体任务是创建数据模型、规则化关联数据、分类聚类和预测、检测异常性等。(5)过程评估。严格检测挖掘的数据结果和电力业务目标之间的吻合性,确定数据模型能不能满足电力业务诉求需要。(6)统一部署。通过统一部署数据模型,以挖掘结果为依据,形成一份专业化的报告。
  1.2 常用方法
  (1)异常分析法。通过异常分析法,旨在稽查电力防盗使用。在国家电力系统,非正常运用电力,常常会产生异常或孤点数据[2]。其中异常数据指的是非正常操作下的电力数据,而孤点数据则指的是与正常电力偏离较远的点。在稽查过程当中,电力企业及侦查机关可统一收集分析用户的电力数据,研究数据的异常情况。这么一来,便能从众多用户当中,大幅缩小调查分析范围,及时监控违法行为,令电力使用更加合理合法。(2)关联分析法。在数学、经济等领域的数据分析中,关联分析法属于一种常用的简单方法。从电力企业上看,通过关联分析法旨在分析两个或以上事物之间的关系。然后,利用其他事物来预测其中某事物,进而深挖在事物间隐藏存在的数据联系,得到要用的數据信息。(3)时间序列法。作为动态分析法之一,时间序列法主要通过时间数列、统计等,来处理分析数据。从电力企业来看,通过时间序列法可以统计分析电力的整体使用趋势、变动情况、无序或循环波动等,从而获得要用的数据信息。(4)聚类分析法。通过聚类分析法,旨在分析数据的基本性质及特征,归类性质相近的事物,而性质差异明显的就归入别的种类之中。不同于判别分析的是,这种方法会先按既有事物性质,通过一定的函数法,来判断性质未知的事物,并在性质已知的事物里加以归入。在应用聚类分析法时,往往并不知晓分析对象的具体类别,来分类处理数据信息。(5)分类分析法。分类分析法主要用于分类有关信息,通过分类模型,一般会分析分类集中得到的某些数据,而获得其他的数据,如离散变量预测分类、连续变量预测回归等。
  2 电力企业内部的大数据现状
  2.1 结构化与半结构化信息数据
  在信息时代下,互联网应用具有大幅增长非结构化数据、半结构化数据的特征。据有关统计可知,以上数据已占据超过75%的数据总量。而数据的网络化又迫使这类数据普遍存在复杂关系。此外,这些数据的形式就是数据流,价值化体现和时间之间具有显著相关性,且价值会稍纵即逝。虽然当前的计算机智能化进步明显,但是仅仅可以分析有结构数据或者类结构数据,所以缺失深层次挖掘数据的效果。
  2.2 收集数据
  在大数据时代下,电力数据除了涵盖历史内部数据外,还涉及互联网、信息部门的数据。在收集信息时,应附上必要的时空标志,如果有必要还应剔除其中的无效数据。此外,还要尽量收集数据来源各异、结构化水平不一样的数据,并尽量对照企业历史数据,以方便验证数据的真实可靠度,所以存在一定的难度。
  2.3 数据关系
  通过观测大量的数据,尽管能够映射出复杂多变的网络,但是这些数据一般孤立存在,不免会映射出片面的数据网络。所以,应有效集成数据,形成一个统一的数据网络。例如,在发电企业中,如果只考虑发电量,则只能得到发电量方面的数据。但发电数据又关乎电压、线损、用电等方面的数据。通过一定的分析法,确定数据之间的关系及复杂网络的联系,是发电企业必须面临的挑战。此外,发供电企业当前缺少统一的信息化系统,所以电力生产、销售等方面的数据往往相互独立存在。为了打破信息孤岛现状,就应融合多方面数据,如发输电、变配用电等的数据。
  3 在电力企业大数据的数据挖掘技术应用
  3.1 从数据源头上收集大数据
  借助现代化设备和技术,如移动设备、自动记录技术、射频识别无线专业技术、互联网等,电力企业将自身的事务型数据与具有决策性作用的外部性质数据,存储到了数据来源层。而为了获得更典型的数据,电力企业还应试着从各种数据源头,收集大数据,以准备好后续数据挖掘的事宜。
  3.2 在数据管理上的应用
  在数据仓库中,常常会存储通过整理、转化过来的电力数据。因为电力数据库不同时,储存标准也会不一样,所以应做好整合转化后,方才可在数据仓库中储存,也即应重新设计数据仓库[3]。数据仓库被重新设计后,便能够按主题要求,设计相应的属性集,以降低处理量。就主题各异的数据库,可通过属性归约法,技术删除冗余信息,获得简化后的数据集。再分类规则表示决策树下的数据集,并在规则知识库储存下来。倘若有必要处理新数据样本,还应按某种规则算法了深入匹配识别,得到综合评价,从而管理好数据。   3.3 在数据整理上的应用
  在整理数据时,数据源内部一般会交叉数据内容,因此应根据互动性,来分类整理观测数据。针对原始数据当中存在的噪声、冗余或者缺失的数据等,还应清洗、解析、重构这些数据,并且适当填补数据,以增大待挖掘数据的价值。通过分类后,主要涉及结构化、半结构化数据、非结构化信息。针对结构化数据,应适当过滤数据,及时剔除无效成分,以更加高效地分析;针对半结构化数据、非结构化数据,就应根据一定的标准,妥善加以处理,形成索引或机器语言。譬如,针对用户评论、系统运行资料等,就先应转换成为模糊或者加权逻辑,再向标准值,映射不一样的词语,来统一规范语言。
  3.4 在数据分析上的应用
  通过处理后的数据,可利用联机处理专业技术,来支持决策过程,进而转化数据信息,形成可辅助决策的有用信息。因为电力企业往往要求数据具有较高的实时性,所以针对电力数据,应注意分类处理,形成实时性与非实时性这两种数据。就非实时性类型的数据,可利用分布式系统、MapReduce云计算来有效加以处理,或通过Hadoop云计算平台,来有效处理数据。针对诸如电力负荷等实时性数据,电力企业可考虑借助内存计算专业技术,来经由内存运行计算所有数据,以加快计算进程;又或可以考虑在云平台前,统一设置前置机,以接收实时性数据。
  3.5 可视化电力企业目标
  在电力企业,通过营销决策体系,借助可视化数据设计,可以通过图形来显示数据中存在的复杂信息,进而可视化数据挖掘得来的成果,并且在电力企业规划设计后续发展时加以灵活运用。通过可视化挖掘深度的数据,可迫使员工充分认知电力企业后续的发展趋势、准确评价决策的正确性。最终结果与实际的符合程度,是挖掘系统成功与否的决定因素。
  4 应用前景展望
  4.1 个性化营销
  从大量的数据信息中,借助数据挖掘专业技术,准确提取用户的基础属性、行为规则,再绘制出用户画像。基于此,电力企业便能够划分好消费群体,并从各种消费群体的基础特性出发,给予个性化的营销服务。另外,通过用户画像,还能帮助使电力企业全方位地了解关键性用户的日常行为规则、用电习惯等,从而为这些重要用户制定服务方略提供必要的依据,以提升服务于关键性用户的质量水平。
  4.2 客户关系维护
  伴随电力行业的飞快发展,电力企业也逐步以服务质量成为市场竞争的核心。众所周知,各用户日常的用电习惯、需求等往往不尽一样。所以,电力企业面临海量的电力用户,应注意紧抓用户需求特点,提供更优质的服务,才能赢得更好地发展。借助数据挖掘专业技术,管理客户、用电、检修等方面的信息,能够在同类别中,纳入用电需求一样的用户。再基于此,向这些类别一样的用户,定制有针对性的服务,再投放必要的广告,令客户更加满意、忠诚。
  4.3 智能化電网
  智能指的是可以深入分析材料、数据,得到系统、全面的理论知识,来妥善处理特定的问题,进而践行商业战略方面的目标。电力行业的智能,指的就是进一步合理化发电、供电、用电的结构系统、深入优化运行程序、增强综合功效等,而形成的一个智慧系统,也就是智能电网。通过同步传输数据、能源,智能电网深度融合能源和信息专业技术后,现已逐步形成一个能源、数据下的可靠、友好、环保型的能源分析管理网络。在融合大数据和国家电网的过程中,往往囊括自发电一直至用户的能源转换全程及输送电力的整个链条。伴随智能电网的飞快进步,通信和信息专业技术也越来越快地融合电网生产、管理与经营。这个信息通信体系现已变成智能电网当中的“中枢神经”,并且支撑着电网生产、经营、管理向前不断发展。在大力行业,整体结构越科学,内部越少摩擦,相应的系统功效也就越大,智慧水平也就越高。当人们和数据进行互动时,就会更便捷地分析汇总,更好地大力支持决策。在新世纪下,我国电网企业现已初步搭建起国际领先、一流水平的集成信息平台。在普及智能电表后,国家电网也从时效性上,深入丰富、拓展了业务数据。基于广泛覆盖的家庭、企业的数据,在网络上的深度挖掘,可深化智能用电控制管理,为用户提供实时的用电数据信息、在线共享能耗信息,达到高效循环使用能源的目标,从而有效促进节能减排。所以,智能电网的进一步发展,有助于数据挖掘专业技术推广应用到电力行业。
  4.4 创建信息系统
  数据资料处理方面,计算机、网络等技术往往更加便捷、高效。所以,为了跟上时代发展的趋势,电力企业也都积极创建信息系统,来统计、分析内外部系统数据,来进一步简化统计用户资料的操作。同时,针对现代化的电力企业,还要注意及时摒弃“围绕产品”的落后管理模式,逐步面向“社会-网民-电力单位”,创新实施“围绕服务”展开的新型“企业网络结构系统”下的管理模式。所以,部分电力企业纷纷开展了新型服务,如网上办电、咨询业务等,并分析、利用了其中产生的信息,而且获益匪浅。在供电企业中,倘若应用这个模型,便能在自组织实时动态监测下,形成一个科学的监测模型,以有效预警、及时妥善处理高峰用电期的问题。在电力企业逐步完善信息系统中,借助数据挖掘专业技术定能达到事半功倍的目标。
  4.5 能源消耗降低
  当电力企业提取用户信息、准确预测负荷、维护管理数据库时,常常需要连续不断地扩大数据中心的实际存储规模。所以,在大数据时代下,高能源消耗、高投入现已逐步变成制约进一步展开数据挖掘的关键性瓶颈之一。据有关能耗问题的报道,从Google上看,数据中心的电量消耗3MW左右/年。但其中仅仅科学、合理地利用了6%~12%。从国内电力企业上看,大部分电能服务器其实常常位处闲置态,主要用于处理负荷高峰等方面的情况。所以,作为现代化的电力企业,需要从大量引进低功耗新型硬件、绿色可再生能源,来统一创建一个数据库等,得以有效缓解当前严重的能耗。在时间序列基础下,预测相似性电价等时,积极再利用节约得到的能源,进而从新的渠道上,另辟数据挖掘途径。
  5 结语
  总之,通过应用数据挖掘专业技术来处理电力大数据信息,发挥出了越来越显著的作用。所以,作为电力企业,应积极分析自身的大数据现状,灵活运用数据挖掘专业技术,来大幅提升服务质量、赢得可持续发展。
  参考文献
  [1] 肖明.大数据时代下数据挖掘技术在企业中的应用[J].中国管理信息化,2015,18(2):58.
  [2] 许凡,孙勤红.大数据时代的数据挖掘技术探讨[J].电子技术与软件工程,2015(16):208.
  [3] 卢建昌,樊围国.大数据时代下数据挖掘技术在电力企业中的应用[J].广东电力,2014(9):88-94.
转载注明来源:https://www.xzbu.com/8/view-15348173.htm