基于三维知识超图的电力智库知识服务平台建设
来源:用户上传
作者:李豪 周爽
摘要:[目的/意义]针对电力智库情报信息获取不全面、逻辑关联提取困难等问题,为电力企业量身打造电力智库知识服务平台。[方法/过程]本文通过对内部信息和外部情报的全方位采集,搭建电力智库知识库,并以知识图谱为基础,引入知识超图概念,提出电力智库三维知识超图架构,从而实现知识多维度提取关联,适应智库研究思路,挖掘数据价值。[结果/结论]针对电力智库研究需求,本文搭建了电力智库知识服务平台,为智库研究提供知识搜索、知识问答、智能推荐、辅助决策等功能,为智库研究提供有效信息指导和思路指引。
关键词:电力智库 知识图谱 知识超图 知识平台 知识推理
分类号:TM181
DOI: 10.19318/j.cnki.issn.2096-1634.2022.03.10
1 引言
面对我国政策环境的不断变化,科学技术飞速发展,能源变革加快转型,各大企业、组织和机构开始建立专门智库,电力企业对智库服务的需求越来越突出。国家电网有限公司(以下简称“国网公司”)在智库建设方面积极探索,组建了以电力科学研究院、能源研究院、电力经济技术研究院等研究机构为中心的智库体系,智库研究蓬勃发展。智库建设作为提升企业软实力的重要手段,逐渐得到了各电力公司和相关企业部门的高度重视。提升智库服务能力对助推电网企业发展起着重要作用[1]。明确企业智库的战略定位,将智库研究从内部视角转向外部视角有利于企业智库健康发展[2]。知识资源是智库生存和发展的关键,构建全面、准确、前沿的知识库是智库研究的坚实基础[3-4]。以往的智库研究依赖人工情报收集和专家知识经验,人工智能技术的应用可以帮助智库的构建从“经验驱动”转变为“数据驱动”,为智库研究人员提供多元化的数据支撑,增强研究成果的科学性和有效性。
知识图谱(knowledge graph,KG)是指将知识工程、人工智能技术与传统的数据库概念相结合而构成的智能知识库,能够囊括多元化数据,同时对数据进行智能化管理、探索、挖掘[5],进而提供智能搜索、智能问答、智能推荐以及智能决策等[6-7]定制化功能,已逐步在金融、公安、医疗等行业广泛应用[8-10]。电力行业也在调度、营销、运检等专业领域开展了知识图谱相关技术的研究和应用[11-13]。针对我国电力物联网的数据特征,蒲天骄等[14]提出了一种基于NoDKG(Not only Domain-specific Knowledge Graph)思想的电力领域知识图谱应用框架设计,并阐述了在客服、调度、运检业务上的应用设计。目前,知识图谱在电力行业的应用主要集中在业务数据可视化展示、业务数据管理分析和电网故障处理检索分析等领域。宋厚岩[15]依托“某电网公司全业务数据智能管控平台”,采用基于知识图谱的图数据库,搭建电力系统知识图谱,通过搜索引擎展示电力系统知识图谱;吕梦平等[16]针对风电数据分散且无法统一管理应用等问题,提出了一种用知识图谱管理风电数据的方法,通过构建风电数据全景知识图谱,实现了不同类型和业务数据间的贯穿统一;郭成等[17]提出面向低压配电网络拓扑知识图谱的构建方法与检索分析方法,采用基于子图匹配的检索方法对电网故障图谱进行检索分析,能够高效地搜索分析出发生故障的原因以及处理措施。
电力智库知识采集需要从能源电力角度出发,延伸至政策环境、市场导向、民生需求等各个方面,目前主要是人工采集、筛选和分析政策情报及相关文件,主观性较强,且存在信息采集不全面、知识碎片化、知识零散化等问题,现有的通用知识图谱无法满足电力智库研究需求。从应用目标出发,可以将知识图谱分为通用知识图谱(common knowledge graph)和垂直知识图谱(vertical domain knowledge graph)[18]。相对于通用知识图谱,垂直领域知识图谱能够更精准、全面地服务于特定专业领域,深度挖掘知识逻辑关系。垂直领域知识图谱能够较好地适应电力智库专业化、开放化、多元化、扁平化和边界模糊化的发展趋势。
电力智库知识服务平台是针对电力智库研究内容和特点量身打造的,能够实现电力内部信息以及外部情报知识的有效获取、精准分类、关联关系、关键信息提取和智能分析推理等功能,为智库研究工作提供前沿、热点、全面且精准的数据信息。
2 电力智库知识库构建
电力智库知识库的构建是电力智库知识服务平台的基础,也是电力智库研究的根本。电力智库知识库的有效性、全面性、针对性和实时性关系到知识体系服务平台的服务水平,也会影响到后续电力智库研究工作的准确性和有效性。
构建电力智库知识库主要包括信息源获取、知识提取、知识融合、知识更新等过程。具体见图1。
2.1 信息源分类及获取
詹姆斯・麦甘[19]指出:“知道最好的信息源在哪里,从中分析高质量信息,信息体现价值,是智库高质量建设的基本要求。”真实、客观、有效的信息源是智库研究的基础,对智库研究起到重要的支撑作用。构建电力智库知识库,首先要进行相关资料的采集,包括数据、文字、图表以及其他媒体资源,涉及结构化、半结构化、非结构化多元化数据信息。为了保证电力智库研究需求,电力智库知识库不仅包括国际、国家、行业等顶层信息,还需要下沉至省、市、区县,以及企业、部门、专业等。针对电力智库研究的领域专业性,信息来源可分为内部信息源和外部信息源两方面。内、外部信息相结合,兼顾了内部信息的专业化和外部信息的多样化(见图2)。
2.1.1 内部信息 内部信息来源于公司内部网站,包括国网公司总部及各网省公司、直属公司通过内网发布的文件、标准、通知、会议纪要,项目的技术规范、可行性研究报告、验收报告以及公司内网发布的媒体新闻报道。内部信息主要为半结构化信息,需要后续对信息进行分类整理、主题标签标注、关键词句信息提取。其中,内部网站发布的新闻报道和研究报告是电力智库内部信息源的重要组成部分,公司新闻报道,包括推动先进理念、先进技术落地实践、理论及应用研究成果、中药会议宣贯等内容,提供电力智库研究所需的企I内部动态信息。在内部网站中提供非常有价值的研究报告,供国网公司内部单位免费下载。国网江苏省电力公司为加强对地方智库研究工作的指导和与之的交流合作,运用信息化手段打通地市层面信息数据接口,定期汇集各地市公司内部情报信息,及时掌握第一手资料。
nlc202207151424
转载注明来源:https://www.xzbu.com/1/view-15436017.htm