(19)中华 人民共和国 国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202111211718.1
(22)申请日 2021.10.18
(71)申请人 国网内蒙古东部电力有限公司
地址 010010 内蒙古自治区呼和浩特市赛
罕区鄂尔多斯东街11号
申请人 中国时代经济出版社有限公司
国网内蒙古东部电力有限公司信息
通信分公司
国网内蒙古东部电力有限公司综合
服务分公司
(72)发明人 杨久勇 田桂申 白雪娇 任春雷
屈春一 章达英 马德民 赵文硕
武艳华 张晶
(74)专利代理 机构 北京安博达知识产权代理有
限公司 1 1271
代理人 徐国文(51)Int.Cl.
G06F 16/36(2019.01)
G06F 40/295(2020.01)
G06F 40/216(2020.01)
G06N 5/02(2006.01)
G06N 7/00(2006.01)
G06N 20/00(2019.01)
G06Q 10/10(2012.01)
(54)发明名称
一种基于知识图谱技术的数据处理方法及
终端设备
(57)摘要
本发明提供的一种基于知识图谱技术的数
据处理方法及终端设备, 包括: 接收数据处理需
求, 利用预先训练的关联模型, 从数据处理需求
中提取数据处理业务,确定各业务对应的业务执
行终端; 基于数据处理业务构建业务流程; 将业
务流程以及流程中的各业务项对应的业务执行
终端以图形的方式进行展示; 关联模 型通过以下
过程来训练: 基于知识图谱技术从多种业务处理
历史数据中进行知识抽取, 得到各实体数据, 再
利用知识融合, 得到数据处理业务以及相关业务
执行终端之间的最优关系。 通过本发明的方案,
在企业数据处理场景中, 将业务处理历史数据、
处理规则和业务执行终端进行关联, 智能生成业
务流程, 提高了 工作效率。
权利要求书2页 说明书9页 附图1页
CN 114372148 A
2022.04.19
CN 114372148 A
1.一种基于知识图谱技 术的数据处 理方法, 其特 征在于, 包括:
接收数据处理需求, 利用预先训练好的关联模型, 从所述数据处理需求中提取数据处
理业务, 确定各 数据处理业务对应的业 务执行终端;
基于所述数据处 理业务构建业 务流程;
将业务流程以及流 程中的各个业 务项对应的业 务执行终端以图形的方式进行展示;
其中所述关联模型通过以下 过程来训练, 包括:
基于知识图谱技术从多种业务处理历史数据中进行知识抽取, 得到各实体数据, 再利
用知识融合 算法, 得到数据处 理业务以及相关业 务执行终端之间的最优关系;
其中, 所述实体数据包括: 数据处 理业务和业务执行终端。
2.根据权利要求1所述的方法, 其特 征在于, 所述关联模型的训练包括:
获取业务处理历史数据和业 务属性数据;
从所述业务处理历史数据和业 务属性数据中确定实体数据;
基于实体对齐算法从所述实体数据中按实体类型进行知识融合, 得到多种类型实体之
间的关系, 进 而构建关联模型;
其中所述实体 类型包括: 业 务执行终端、 数据处 理业务和业务执行服务器。
3.根据权利要求2所述的方法, 其特征在于, 所述从所述业务处理历史数据和业务属性
数据中确定实体数据, 包括:
当所述业务处理历史数据和业务属性数据为半结构化数据或非结构化数据时, 对所述
业务处理历史数据和业 务属性数据进行知识抽取, 得到实体数据;
当所述业务处理历史数据和业务属性数据为结构化数据时, 对所述业务处理历史数据
或业务属性数据进行整合得到实体数据;
所述业务处理历史数据和业务属性数据还包括数据类型, 所述数据类型包括: 结构化
数据、 半结构化数据和非结构化数据。
4.根据权利要求3所述的方法, 其特征在于, 所述知识抽取包括: 实体抽取、 关系抽取和
属性抽取。
5.根据权利要求2所述的方法, 其特征在于, 所述基于实体对齐算法从所述实体数据中
按实体类型进行知识融合, 得到多种类型实体之间的关系, 进 而构建关联模型, 包括:
按实体类型采用三元组格式构建训练集;
基于所述训练集, 采用基于贝叶斯估计的实体对齐算法, 通过映射相关属性, 进行知识
融合。
6.根据权利要求2所述的方法, 其特征在于, 所述基于所述本体模型, 采用基于贝叶斯
估计的实体对齐算法, 通过映射相关属性, 进行知识融合, 包括:
基于一个待融合实体, 从所述训练集中确定与 所述待融合实体具备相同或近义实体的
多个实体;
从所述多个实体中采用相似度分析法进行判断, 得到相关度最高的实体;
对齐所述待融合与相关度最高的实体, 连接相关属性, 并进行 标注。
7.根据权利要求6所述的方法, 其特 征在于, 所述实体的三元组表示方式如下:
G=(E,R,S)
其中E={e1,e2, …e|E|}和S={s1,s2, …s|S|}分别是训练集中 的要对齐的实体集合,权 利 要 求 书 1/2 页
2
CN 114372148 A
2共包含|E|和|S|种不同的类型的实体; R={r1,r2, …r|R|}是训练集中各实体的关系集合,
共包含|R|种不同关系。
8.根据权利要求1所述的方法, 其特征在于, 所述将业务流程以及流程中的各个业务项
对应的业 务执行终端以图形的方式进行展示, 包括:
以数据处理业务为节点, 以各数据处理业务之间的关系为边, 同时基于各数据处理业
务中可能会出现的异常为标签构建流 程图;
基于业务流程中各项目节点, 设置 显示框, 用于展示该项目负责的业 务执行终端;
同时为所述节点、 边、 标签和显示框设置不同的颜色。
9.根据权利要求8所述的方法, 其特征在于, 所述将业务流程以及流程中的各个业务项
对应的业 务执行终端以图形的方式进行展示, 之后还 包括:
对于所述节点、 边、 标签和显示框中的内容进行修改, 优化 业务流程。
10.一种终端设备, 其特征在于, 包括存储器、 处理器以及存储在所述存储器中并可在
所述处理器上运行的计算机程序, 所述处理器执行所述计算机程序时实现如权利要求 1至9
任一项所述方法的步骤。权 利 要 求 书 2/2 页
3
CN 114372148 A
3
专利 一种基于知识图谱技术的数据处理方法及终端设备
文档预览
中文文档
13 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-19 01:59:45上传分享