(19)中华 人民共和国 国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202111211723.2
(22)申请日 2021.10.18
(71)申请人 国网内蒙古东部电力有限公司
地址 010010 内蒙古自治区呼和浩特市赛
罕区鄂尔多斯东街11号
申请人 中国时代经济出版社有限公司
国网内蒙古东部电力有限公司信息
通信分公司
国网内蒙古东部电力有限公司综合
服务分公司
(72)发明人 白雪娇 王东升 田桂申 屈春一
曹阳 柴占军 章达英 邹睿翀
吴小锋 刘琦
(74)专利代理 机构 北京安博达知识产权代理有
限公司 1 1271
代理人 徐国文(51)Int.Cl.
G06F 16/36(2019.01)
G06N 5/02(2006.01)
G06F 40/295(2020.01)
G06F 40/216(2020.01)
G06F 40/211(2020.01)
G06F 40/30(2020.01)
G06N 7/00(2006.01)
G06N 20/00(2019.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
一种基于语义网络的数据 挖掘系统
(57)摘要
本发明提供的一种基于语义网络的数据挖
掘系统, 包括: 匹配模块, 用于接收数据分析需
求, 利用预先训练好的关系模型, 从数据分析需
求中提取数据挖掘业务, 确定各数据挖掘业务对
应的业务节点; 确定模块, 用于基于数据挖掘业
务构建挖掘工作流; 展示模块, 用于将挖掘工作
流以及流程中的各个业务项对应的业务节点 以
可视化的方式进行展示。 通过本发明的方案, 在
企业数据挖掘场景中, 将处理历史数据、 挖掘规
则和业务节点进行关联, 智能生成挖掘工作流,
提高了工作效率。
权利要求书2页 说明书9页 附图1页
CN 114357175 A
2022.04.15
CN 114357175 A
1.一种基于语义网络的数据 挖掘系统, 其特 征在于, 包括:
匹配模块, 用于接收数据分析需求, 利用预先训练好的关系模型, 从所述数据分析需求
中提取数据挖掘业务, 确定各 数据挖掘业务对应的业 务节点;
确定模块, 用于基于所述数据 挖掘业务构建挖掘工作流;
展示模块, 用于将挖掘工作流以及流程中的各个业务项对应的业务节点以可视化的方
式进行展示;
其中所述关系模型通过以下 过程来训练, 包括:
获取与业 务节点相关的上 下文信息;
将获得的上下文信 息输入到第 一神经网络模型, 以确定与业务节点相关的实体之间的
关系, 获得业 务节点的第一语义网络;
从服务器接收共享语义网络;
通过将获得的第一语义网络和接收的共享语义网络输入到用于扩展第一语义网络的
第二神经网络模型, 获得业 务节点的第二语义网络;
基于所述第二语义网络从多个处理历史数据中进行知识提取, 得到各实体数据, 然后
利用知识集成算法, 得到数据 挖掘业务以及相关业 务节点之间的最优关系;
其中, 所述实体数据包括: 数据 挖掘业务和业务节点。
2.根据权利要求1所述的系统, 其特 征在于,
所述共享语义网络由所述 服务器基于由所有业 务节点提供的语义网络数据来 生成。
3.根据权利要求1所述的系统, 其特征在于, 所述将 获得的上下文信 息输入到第 一神经
网络模型, 进一 步包括:
将所述上下文信 息的文本信 息输入到所述第 一神经网络模型中; 确定所述第 一语义网
络的隐私级别, 并将所确定的隐私级别输入到所述第一神经网络模型;
其中, 从第 一神经网络模型输出的第 一语义网络中的数据包括根据所述隐私级别提取
的数据。
4.根据权利要求1所述的系统, 其特征在于, 所述从服务器接收共享语义网络, 进一步
包括:
向服务器发送关于业 务节点的简档的信息;
从服务器接收与所述 业务节点的简档相关的共享语义网络 。
5.根据权利要求1所述的系统, 其特 征在于, 所述关系模型的训练包括:
获取处理历史数据和业 务属性数据;
从所述处 理历史数据和业 务属性数据中确定实体数据;
基于实体对齐算法从所述实体数据中按实体类型进行知识集成, 得到多种类型实体之
间的关系, 进 而构建关系模型;
其中所述实体 类型包括: 业 务节点、 数据 挖掘业务和业务执行服务器。
6.根据权利要求5所述的系统, 其特征在于, 所述从所述处理历史数据和业务属性数据
中确定实体数据, 包括:
当所述处理历史数据和业务属性数据为半结构化数据或非结构化数据时, 对所述处理
历史数据和业 务属性数据进行知识提取, 得到实体数据;
当所述处理历史数据和业务属性数据为结构化数据时, 对所述处理历史数据或业务属权 利 要 求 书 1/2 页
2
CN 114357175 A
2性数据进行整合得到实体数据;
所述处理历史数据和业务属性数据还包括数据类型, 所述数据类型包括: 结构化数据、
半结构化数据和非结构化数据。
7.根据权利要求6所述的系统, 其特征在于, 所述知识提取包括: 实体提取、 关系提取和
属性提取。
8.根据权利要求5所述的系统, 其特征在于, 所述基于实体对齐算法从所述实体数据中
按实体类型进行知识集成, 得到多种类型实体之间的关系, 进 而构建关系模型, 包括:
按实体类型采用三元组格式构建训练数据;
基于所述训练数据, 采用基于贝叶斯估计的实体对齐算法, 通过映射相关属性, 进行知
识集成。
9.根据权利要求5所述的系统, 其特征在于, 所述基于所述本体模型, 采用基于贝叶斯
估计的实体对齐算法, 通过映射相关属性, 进行知识集成, 包括:
基于一个待集成实体, 从所述训练数据中确定与 所述待集成实体具备相同或近义实体
的多个实体;
从所述多个实体中采用相似度 挖掘算法进行判断, 得到相关度最高的实体;
对齐所述待集成与相关度最高的实体, 连接相关属性, 并进行 标注。
10.根据权利要求9所述的系统, 其特 征在于, 所述实体的三元组表示方式如下:
G=(E,R,S)
其中E={e1,e2,…e|E|}和S={s1,s2,…s|S|}分别是训练数据中的要对齐的实体集合, 共
包含|E|和|S|种不同的类型的实体; R={r1,r2,…r|R|}是训练数据中各实体的关系集合,
共包含|R|种不同关系。权 利 要 求 书 2/2 页
3
CN 114357175 A
3
专利 一种基于语义网络的数据挖掘系统
文档预览
中文文档
13 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-19 01:59:51上传分享