本技术涉及知识图谱,特别是涉及一种电力系统知识图谱构建方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
背景技术:
1、电力系统中,通常基于scada(supervisory control and data acquisition)监控电力系统中设备的运行,并采集电力系统中不同数据源下的数据,以进行决策分析。如何有效融合多种数据源下的数据,为电力系统提供决策支持,对电力系统的管理和运维至关重要。
2、传统技术中,可以通过人工进行数据整合或基于计算机简单的进行数据统计,融合电力系统中多种数据源下的数据,但这一方式,无法有效消除不同数据源下数据之间的歧义,也无法有效挖掘不同数据源下数据之间的隐式关联,导致融合后的电力系统数据无法为电力系统的管理和运维提供有效支撑。
技术实现思路
1、基于此,有必要针对上述技术问题,提供一种能够有效消除电力系统不同数据源下数据之间的歧义,并有效挖掘不同数据源下数据之间隐式关联,进而为电力系统的管理和运维提供有效支撑的电力系统知识图谱构建方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
2、第一方面,本技术提供了一种电力系统知识图谱构建方法,包括:
3、获取电力系统的结构化数据和非结构化数据,对结构化数据和非结构化数据分别进行图谱元素抽取,得到图谱元素,基于图谱元素构建初始知识图谱;
4、获取电力系统的多源原始数据,将多源原始数据中的异常数据筛除,并将保留的多源原始数据进行时间戳同步处理,得到多源目标数据;
5、融合初始知识图谱和多源目标数据,得到融合知识图谱;
6、对融合知识图谱进行图谱数据推理,得到图谱补全数据,基于图谱补全数据对融合知识图谱进行图谱数据补全,得到目标知识图谱。
7、在其中一个实施例中,对结构化数据和非结构化数据分别进行图谱元素抽取,得到图谱元素,包括:
8、基于为结构化数据配置的图谱元素映射规则,对结构化数据进行图谱元素抽取,得到第一图谱元素;
9、基于非结构化数据的数据量和领域类型,确定与非结构化数据匹配的图谱元素抽取规则,按照图谱元素抽取规则,对非结构化数据进行图谱元素抽取,得到第二图谱元素;
10、汇集第一图谱元素和第二图谱元素,得到用于构建初始知识图谱的图谱元素。
11、在其中一个实施例中,基于非结构化数据的数据量和领域类型,确定与非结构化数据匹配的图谱元素抽取规则,按照图谱元素抽取规则,对非结构化数据进行图谱元素抽取,得到第二图谱元素,包括:
12、当非结构化数据的数据量小于预设数量,或非结构化数据属于存在可提取语义特征的限定领域,提取非结构化数据中的语义特征;
13、生成与所提取的语义特征匹配的文本提取模板;
14、基于文本提取模板,从非结构化数据中抽取得到第二图谱元素。
15、在其中一个实施例中,基于非结构化数据的数据量和领域类型,确定与非结构化数据匹配的图谱元素抽取规则,按照图谱元素抽取规则,对非结构化数据进行图谱元素抽取,得到第二图谱元素,包括:
16、当非结构化数据的数据量大于或等于预设数量,或非结构化数据属于不存在可提取语义特征的开放领域,对非结构化数据进行数据标注;
17、基于预设数据抽取模型,对已完成数据标注的非结构化数据进行图谱元素抽取,得到第二图谱元素。
18、在其中一个实施例中,融合初始知识图谱和多源目标数据,得到融合知识图谱,包括:
19、生成包含多源目标数据的待融合图谱;
20、对初始知识图谱与待融合图谱进行知识图谱对齐处理,确定初始知识图谱和待融合知识图谱之间的等价图谱元素对;
21、基于等价图谱元素对,融合初始知识图谱和待融合图谱,得到融合知识图谱。
22、在其中一个实施例中,对融合知识图谱进行图谱数据推理,得到图谱补全数据,基于图谱补全数据对融合知识图谱进行图谱数据补全,得到目标知识图谱,包括:
23、对融合知识图谱中多个实体之间的连接关系进行关系挖掘,得到第一图谱补全数据;
24、基于由融合知识图谱中多个实体之间连接关系构成的路径,进行路径预测,得到第二图谱补全数据;
25、获取融合知识图谱中实体和实体之间连接关系的分布式向量表示,从分布式向量表示中提取融合知识图谱中的隐式关联信息,得到第三图谱补全数据;
26、基于第一图谱补全数据、第二图谱补全数据和第三图谱补全数据,对融合知识图谱进行图谱数据补全,得到目标知识图谱。
27、第二方面,本技术还提供了一种电力系统知识图谱构建装置,包括:
28、初始图谱构建模块,用于获取电力系统的结构化数据和非结构化数据,对结构化数据和非结构化数据分别进行图谱元素抽取,得到图谱元素,基于图谱元素构建初始知识图谱;
29、多源目标数据获取模块,用于获取电力系统的多源原始数据,将多源原始数据中的异常数据筛除,并将保留的多源原始数据进行时间戳同步处理,得到多源目标数据;
30、图谱融合模块,用于融合初始知识图谱和多源目标数据,得到融合知识图谱;
31、图谱数据推理模块,用对融合知识图谱进行图谱数据推理,得到图谱补全数据,基于图谱补全数据对融合知识图谱进行图谱数据补全,得到目标知识图谱。
32、第三方面,本技术还提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
33、获取电力系统的结构化数据和非结构化数据,对结构化数据和非结构化数据分别进行图谱元素抽取,得到图谱元素,基于图谱元素构建初始知识图谱;
34、获取电力系统的多源原始数据,将多源原始数据中的异常数据筛除,并将保留的多源原始数据进行时间戳同步处理,得到多源目标数据;
35、融合初始知识图谱和多源目标数据,得到融合知识图谱;
36、对融合知识图谱进行图谱数据推理,得到图谱补全数据,基于图谱补全数据对融合知识图谱进行图谱数据补全,得到目标知识图谱。
37、第四方面,本技术还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
38、获取电力系统的结构化数据和非结构化数据,对结构化数据和非结构化数据分别进行图谱元素抽取,得到图谱元素,基于图谱元素构建初始知识图谱;
39、获取电力系统的多源原始数据,将多源原始数据中的异常数据筛除,并将保留的多源原始数据进行时间戳同步处理,得到多源目标数据;
40、融合初始知识图谱和多源目标数据,得到融合知识图谱;
41、对融合知识图谱进行图谱数据推理,得到图谱补全数据,基于图谱补全数据对融合知识图谱进行图谱数据补全,得到目标知识图谱。
42、第五方面,本技术还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
43、获取电力系统的结构化数据和非结构化数据,对结构化数据和非结构化数据分别进行图谱元素抽取,得到图谱元素,基于图谱元素构建初始知识图谱;
44、获取电力系统的多源原始数据,将多源原始数据中的异常数据筛除,并将保留的多源原始数据进行时间戳同步处理,得到多源目标数据;
45、融合初始知识图谱和多源目标数据,得到融合知识图谱;
46、对融合知识图谱进行图谱数据推理,得到图谱补全数据,基于图谱补全数据对融合知识图谱进行图谱数据补全,得到目标知识图谱。
47、上述电力系统知识图谱构建方法、装置、计算机设备、计算机可读存储介质和计算机程序产品,先对电力系统的结构化数据和非结构化数据分别进行图谱元素抽取,得到图谱元素,从而基于图谱元素构建初始知识图谱,以便后续可以基于初始知识图谱存储电力系统中不同数据源下的数据。进一步的,可以获取电力系统的多源原始数据,将多源原始数据中的异常数据筛除,并将保留的多源原始数据进行时间戳同步处理,得到数据质量更高、来自不同数据源的多源目标数据。然后,融合初始知识图谱和多源目标数据,以消除不同数据源下数据之间的歧义,得到融合知识图谱,再对融合知识图谱进行图谱数据推理,以有效挖掘不同数据源下数据之间的隐式关联,得到图谱补全数据,从而基于图谱补全数据对融合知识图谱进行图谱数据补全,得到目标知识图谱,以便后续可以基于目标知识图谱中存储的不同数据源下的数据,为电力系统的管理和运维提供有效支撑。即可以基于上述方法,得到能消除电力系统中不同数据源下数据之间歧义、有效挖掘不同数据源下数据之间隐式关联、存储有电力系统中不同数据源下数据的目标知识图谱,有利于后续基于目标知识图谱中融合的多源数据为电力系统的管理和运维提供有效支撑。
1.一种电力系统知识图谱构建方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述对所述结构化数据和所述非结构化数据分别进行图谱元素抽取,得到图谱元素,包括:
3.根据权利要求2所述的方法,其特征在于,所述基于所述非结构化数据的数据量和领域类型,确定与所述非结构化数据匹配的图谱元素抽取规则,按照所述图谱元素抽取规则,对所述非结构化数据进行图谱元素抽取,得到第二图谱元素,包括:
4.根据权利要求2所述的方法,其特征在于,所述基于所述非结构化数据的数据量和领域类型,确定与所述非结构化数据匹配的图谱元素抽取规则,按照所述图谱元素抽取规则,对所述非结构化数据进行图谱元素抽取,得到第二图谱元素,包括:
5.根据权利要求1所述的方法,其特征在于,所述融合所述初始知识图谱和所述多源目标数据,得到融合知识图谱,包括:
6.根据权利要求1所述的方法,其特征在于,所述对所述融合知识图谱进行图谱数据推理,得到图谱补全数据,基于所述图谱补全数据对所述融合知识图谱进行图谱数据补全,得到目标知识图谱,包括:
7.一种电力系统知识图谱构建装置,其特征在于,所述装置包括:
8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
