You are on page 1of 3

信息与电脑

2022 年第 17 期 Information & Computer 计算机工程应用技术

基于知识图谱的电力设备知识检索应用研究
宋珂凡

(南京理工大学 设计艺术与传媒学院,江苏 南京 210094)

摘 要:文章旨在研究解决电力设备信息和相关资料查找效率低、准确率不高、现有知识对故障处理等任务支撑不
足的问题。针对基层业务人员需求构建电力知识图谱,并将其应用于设备域知识查找过程,将制度标准相关文档和设备
缺陷相关动态信息等多源异构数据转化为知识内容,再结合场景制定知识抽取规则。基于知识融合结果实现设备域知识
图谱可视化呈现,有效减轻了基层人员的业务负担,解决以往数据隔离和数据难以高效利用的问题,符合电网数字化建
设的要求。
关键词:知识图谱;多源异构;知识抽取;电力设备;知识标签
中图分类号:TP391.1  文献标识码:A  文章编号:1003-9767(2022)17-027-03

Research on Power Equipment Information Retrieval Based on Knowledge


Atlas

SONG Kefan

(School of Design Art and Media, Nanjing University of Science and Technology, Nanjing Jiangsu 210094, China)

Abstract: The purpose of this paper is to study and solve the problems of low efficiency, low accuracy, and insufficient support of
existing knowledge for troubleshooting tasks such as power equipment information and related data. According to the needs of grass-
roots business personnel, a power knowledge map is constructed and applied to the equipment domain. In the process of knowledge
search, multi-source heterogeneous data such as documents related to system standards and dynamic information related to equipment
defects are converted into knowledge content, and knowledge extraction rules are formulated in combination with scenarios. Based
on the results of knowledge fusion, the visualization of the knowledge graph in the equipment domain is realized, which effectively
reduces the business burden of grass-roots personnel, solves the previous situation of data isolation and data is difficult to use
efficiently, and meets the requirements of the digital construction of the power grid.
Keywords: knowledge graph; multi-source heterogeneity; knowledge extraction; power equipment; knowledge labeling

0 引言 1 行业现状
随着人工智能和大数据的快速发展,传统行业逐渐走向 伴随电力行业信息化程度深入和数字化建设需求,电力
数字化变革新领域,电力行业性质决定了复杂海量的知识内 数据快速增长。电力作为国家主要的能源体系,其数据来源
[1]
容,尤其以设备为主的知识素材 。知识图谱已经广泛应用 多样,贯穿于发电、变电、输电以及配电等各个环节,但各
于人工智能和自然语言等领域,并取得了良好的应用效果。 环节缺乏标准化数据输出格式,导致数据表示方式多样、数
电力设备相关信息海量且复杂,文献 [2] 基于确立语义框架 据维度多样,在结构化数据基础上产生大量非结构化数据。
表示文本,但难以适应复杂多变的设备信息;文献 [3] 利用 该部分数据以文本、音频及视频等非结构化形式存储,构成
机器学习算法挖掘语料中的规律来表示语料特征。但是,系 了复杂、庞大、多源以及异构的数据资源 [4-6]。
统容易局限于设备缺陷的字面解读,而运用知识图谱构建数 设备作为各个环节重要的链接点,以设备为主主体的工
据库能够有效快速建立电力知识网络,从而实现设备信息智 作占到 60% 以上的工作量,且设备所关联的缺陷记录和故障
能化管理 [2-3]。 维修记录等动态数据影响着该设备能否正常工作和运行检修

收稿日期:2022-07-02
作者简介:宋珂凡 (1998—),女,陕西铜川人,硕士研究生在读。研究方向:设计应用、人工智能、知识赋能。

— 27 —
信息与电脑
计算机工程应用技术 Information & Computer 2022 年第 17 期

班组能否高效工作。因此,以设备为线索构建海量设备数据 信息包含设备类型、投运日期、调管单位、厂家名称、设备
库,通过实体、属性和关系的定义实现设备基础信息、运维 技术参数、设备价值信息、设备运维资料、设备缺陷记录、
参数及相关技术标准规范等多维度数据,实现设备数据的高 设备大修技改以及设备绩效评价等;设备非结构化数据主要
效检索,减少业务人员负担,提高搜索效率。 涵盖设备技术标准、管理制度、技术资料以及故障分析报
构建设备知识图谱的前提是梳理设备的相关数据,得 告等。对上述内容进行聚类分析,可大致分为 5 类,即基
出设备相关知识体系,如图 1 所示,进而基于分类内容指定 本信息数据、在线实时数据、运行数据、试验数据和事故
规则抽取知识。设备结构化数据分为了 8 个维度,设备基础 数据。

图 1 设备知识体系
2 设备知识图谱构建
2.1 以变电为例的设备知识信息抽取

由于变电站的一次设备相关信息复杂多样,机器难以
完成精准识别和处理,因此以变电站设备基本信息为例,通
过识别设备实体与设备参数信息的语义关系完成数据抽取的
过程。该过程运用隐马尔可夫文本分词模型识别变电站大
量构词复杂的专业术语,如变压器 1 电压等级为 35 kV 的
分 词 结 果 为 变 压 器 1- 电 压 等 级 -35 kV, 实 现 设 备 信 息 预 图 2 设备知识图谱构建流程图
处理。
呈现设备知识的图谱化,再通过可视化的人机交互快速定位
2.2 设备知识图谱检索架构 项目资料和各设备验收标准等知识。设备知识时序分析对设
备子图、维护有时间标签的时序知识(交接试验、例行试验
知识图谱构建一般分为 3 个步骤,分别为知识抽取、知识
和故障报告等),通过时间轴拖拽呈现设备投运动态。
融合和知识加工。知识抽取主要对抽取目标的非结构化和半结
构化数据采用不同的抽取方法、规则,抽取数据包含的实体、 3.2 不同业务部门的系统应用
属性及关系,并整合实体、属性和关系,加入现有结构化数据
(1)运维班组。一线业务人员在业务过程中需要完成
列表,初步形成知识图谱。知识融合根据知识结构不断更新知
大量查询资料任务,主要是技术标准规范、厂家白图及以往
识图谱元素内容,根据业务内容更新和填充结构;知识加工是
运维资料等来源各异的资料内容。该业务人员可通过搜索“xx
指在应用过程中评估其质量和应用效果,指正和修订知识图谱。
变压器 + 规范”内容,提供该权限范围内的设备规范资料和
设备知识图谱构建流程如图 2 所示。知识图谱构建的设备知识
该资料关联的其他知识网,供用户高速检索。
网络通过多次迭代优化来实现图谱检索和可视化内容展示。
(2)检修班组。经验丰富的检修人员需要快速识别设
3 知识图谱的系统应用 备型号,做好查找以往故障报告和缺陷记录等辅助工作。该
过程需要借助不同媒介,存在信息转化率低、新手员工难以
3.1 知识检索
入手的缺点,而业务人员可以输入该设备信息,后台通过预
业务人员可以输入检索内容,经过语义理解将输入内容 先定义的问答模板推送相应的问题信息,工作人员点击对应
转化为机器可识别的内容。基于已有的设备知识图谱网络识 问题即可获得,如该列表无对应信息支持换一换或查看更多,
别该实体关系,通过实体 - 属性 - 关系三元组的形式展示, 页面右侧同时提供该设备的知识图谱。系统架构流程如图 3

— 28 —
信息与电脑
2022 年第 17 期 Information & Computer 计算机工程应用技术

图 3 系统架构图

所示。 能操作,实现数字化业务赋能。在后续研究中,笔者需要从
知识抽取和知识更新等各个步骤进一步提升知识图谱的准确
4 关键技术
性,保证知识检索结果的有效性。
隐马尔可夫模型是关于时序的概率模型,由一个隐藏的
马尔可夫链随机生成不可观测的状态随机序列,再由各个状
态生成一个观测而产生观测随机序列的过程 [7]。隐马尔可夫 参考文献
随机生成的状态序列,称为状态序列;每个状态生成一个观 [1] 刘津 , 杜宁 , 徐菁 , 等 . 知识图谱在电力领域的应用与研
测,而由此产生的观测随机序列,称为观测序列。隐马尔可 究 [J]. 电力信息与通信技术 ,2020,18(1):60-66.
夫模型有 3 种应用场景,命名实体识别仅用到其中一种“求 [2] 赵振兵 , 段记坤 , 孔英会 , 等 . 基于门控图神经网络的栓母
观察序列背后最可能的标注序列”。 对知识图谱构建与应用 [J]. 电网技术 ,2021,45(1):98-106.
一种端到端的三元组联合抽取模型(BiLSTM-DCGAT- [3] 张肃 , 许慧 . 基于知识图谱的企业知识服务模型构建研
AT)从句中的线性关系和依存关系抽取句子序列与区域特性, 究 [J]. 情报科学 ,2020,38(8):68-73.
使用图注意力网络结合依存约束矩阵计算句法依存图的节点 [4] 唐红雨 , 黄海峰 , 唐玉庆 , 等 . 智能型设备温度和电流测试
权重,动态学习实体关系的特征表示,从而实现实体关系的 装置设计 [J]. 电气传动 ,2019,49(5):93-96.
联合抽取 。 [8] [5] 吴小刚 , 许士锦 , 陈兴望 , 等 . 基于知识图谱的电网智能调
决策树算法是数据挖掘中的核心算法之一,是从一组无 度辅助决策系统设计 [J]. 信息技术 ,2021(12):60-65.
次序、无规则的海量数据中挖掘有效的、正确的且可理解的 [6] 李坚林 , 张晨晨 , 赵昊然 , 等 . 基于多源数据融合的电网设
[9]
模式 。决策树算法采用自顶向下的递归方式,在决策树的 备技术监督知识图谱构建 [J]. 电工电气 ,2021(9):60-63.
内部节点比较属性值,并根据不同的属性值判断从该节点向 [7] 林游龙 . 基于隐马尔可夫模型的分词算法的设计与实现 [J].
下的分支,在树的叶节点得到结论 [10]
。 网络安全技术与应用 ,2022(8):27-29.
KG-BERT(BERT for Knowledge Graph Completion)是 [8] 翟 社 平 , 柏 晓 夏 , 张 宇 航 , 等 . 融 合 依 存 分 析 和 图 注
应用于知识图谱补全领域的算法 [11]
。传统补全算法仅探索实 意 网 络 的 三 元 组 抽 取 [J/OL]. 计 算 机 工 程 与 应 用 :1-10
体与实体之间的连接关系,而 KG-BERT 将实体进行语义上 [2022-10-08].http://kns.cnki.net/kcms/detail/11.2127.
的扩充,并将扩充后的语义描述作为实体特征,如将实体“苹 TP.20220622.1015.004.html.
果”的语义扩充为“苹果为世界四大水果之一,性味甘酸而平, [9] 赵 晨 熙 , 徐 金 梧 , 黎 敏 , 等 . 基 于 决 策 树 算 法 规 则
无毒,具有生津止渴、益脾止泻、和胃降逆的功效。”最后, 抽 取 的 COREX 燃 料 配 比 模 型 [J]. 计 算 机 应 用 研
将扩充后的语义特征输入 BERT 预训练神经网络模型,并提 究 ,2012,29(12):4567-4570.
取特征与分类预测。 [10] 赵 振 兵 , 段 记 坤 , 孔 英 会 , 等 . 基 于 门 控 图 神 经 网 络 的
栓 母 对 知 识 图 谱 构 建 与 应 用 [J]. 电 网 技 术 ,2021,45(1):
5 结语 98-106.
将知识图谱技术应用于电力知识管理领域,有效实现了 [11] 杨通超 , 唐向红 . 改进 KG-BERT 算法的涉毒案件法条预
电力知识的高效检索和可视化呈现,提供变电、输电、配电 测方法 [J]. 软件导刊 ,2022,21(5):79-83.
设备稳定运行的数据支撑,辅助各个部门和业务人员进行智

— 29 —

You might also like