iso file download
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111232526.9 (22)申请日 2021.10.2 2 (71)申请人 中国人民解 放军战略支援 部队信息 工程大学 地址 450000 河南省郑州市高新区科 学大 道62号 (72)发明人 尹美娟 胡红卫 刘晓楠 伍润民 刘威 罗向阳 颜志豪 (74)专利代理 机构 郑州大通专利商标代理有限 公司 41111 代理人 周艳巧 (51)Int.Cl. G06F 40/279(2020.01) G06F 40/126(2020.01) G06N 20/00(2019.01) (54)发明名称 基于关系导向的实体关系联合抽取方法及 系统 (57)摘要 本发明属于自然语 言处理技术领域, 特别涉 及一种基于关系导向的实体关系联合抽取方法 及系统, 对目标文本中句子进行编码, 获取目标 文本中句子向量表示; 针对句子向量表示, 利用 关系抽取模块抽取目标文本中所包含的关系类 型; 将抽取的关系类型作为先验知识与目标文本 句子中词向量表示进行融合, 利用实体识别模块 来识别目标文本中与抽取的关系类型对应的实 体。 本发明能够减少对无关实体的关注, 避免抽 取冗余实体, 进而对识别出的多个 关系类型分别 识别其对应的实体对, 解决实体重叠问题, 最终 抽取出句子中所包含的全部实体关系三元组, 提 升实体关系识别准确度, 便 于实际场景应用。 权利要求书2页 说明书10页 附图3页 CN 113887211 A 2022.01.04 CN 113887211 A 1.一种基于关系导向的实体关系联合抽取 方法, 其特 征在于, 包 含如下内容: 对目标文本中句子进行编码, 获取目标文本中句子向量表示; 针对句子向量表示, 利用关系抽取模块抽取目标文本中所包 含的关系类型; 将抽取的关系类型作为先验知识与目标文本句子中词向量表示进行融合, 利用实体识 别模块来识别目标文本中与抽取的关系类型对应的实体。 2.根据权利要求1所述的基于关系导向的实体关系联合抽取方法, 其特征在于, 采用预 训练的BERT模型对目标文本中句子进行编码, 获取目标文本中各单词嵌入词向量, 并通过 捕捉句子特 征生成句子上 下文的向量表示。 3.根据权利要求2所述的基于关系导向的实体关系联合抽取方法, 其特征在于, 在目标 文本中句子句首添加分类标识符, 将添加分类标识符 的句子作为BERT模型输入, 通过BERT 模型进行编码, 获取输出的句子向量表示。 4.根据权利要求1所述的基于关系导向的实体关系联合抽取方法, 其特征在于, 关系抽 取模块中, 通过采用sigmoid函数将关系抽取建模为多标签二元分类任务, 来识别并输出句 子向量表示中的多种关系类型。 5.根据权利要求4所述的基于关系导向的实体关系联合抽取方法, 其特征在于, 多标签 二元分类任务表示为: pr=σ(Wr·hcls+br), 其中, pr为输出的关系类型标签, Wr∈RN×d, N为总 关系类型数量, d为句 子向量表示维度大小, br为偏置向量, σ 表示sigmoid函数, hcls为句子 向量。 6.根据权利要求5所述的基于关系导向的实体关系联合抽取方法, 其特征在于, 关系抽 取模块损失函数采用二分类交叉熵函数, 该二分类交叉熵函数表示 为: 其中, yi为真实关系类型 标签。 7.根据权利要求1或4或5或6所述的基于关系导向的实体关系联合抽取方法, 其特征在 于, 针对抽取的多种关系类型(r1,r2,...,rm), m为抽取的关系数量, 根据索引利用查表法进 行编码, 获取关系类型编 码向量, 将句子中词向量表示和关系类型编 码向量叠加融合, 以利 用实体识别模块输出与抽取的关系类型对应的实体。 8.根据权利要求1所述的基于关系导向的实体关系联合抽取方法, 其特征在于, 将抽取 的关系类型和目标文本句 子中词向量表示叠加融合, 作为实体识别模块输入向量, 基于抽 取的关系类型分别采用二进制指 针标记关系类型对应的实体位置, 依据实体位置获取关系 类型对应的实体三元组(头实体, 关系, 尾实体)。 9.根据权利要求8所述的基于关系导向的实体关系联合抽取方法, 其特征在于, 标记实 体位置中, 采用两个相同二元分类器对头实体和尾实体进行解码, 其中一个分类器标记实 体开始位置, 另一个分类器标记实体结束位置, 对输入向量每个单词分配一个二进制标签 并检测单词作为实体开始和结束位置的概率, 并依据就近原则, 选取与开始位置最近距离 的结束位置来 生成关系类型对应的实体。 10.一种基于关系导向的实体关系联合抽取系统, 其特征在于, 包含: 句子编码模块、 关 系抽取模块及实体识别模块, 其中, 句子编码模块, 用于对目标文本中句子进行编码, 获取目标文本中句子向量表示;权 利 要 求 书 1/2 页 2 CN 113887211 A 2关系抽取模块, 用于针对句子向量表示, 利用关系抽取模块抽取目标文本中所包含的 关系类型; 实体识别模块, 用于将抽取的关系类型作为先验知识与目标文本句子中词向量表示进 行融合, 利用实体识别模块 来识别目标文本中与抽取的关系类型对应的实体。权 利 要 求 书 2/2 页 3 CN 113887211 A 3
专利 基于关系导向的实体关系联合抽取方法及系统
文档预览
中文文档
16 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助3元下载(无需注册)
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助3元下载
本文档由 人生无常 于
2024-03-19 02:01:45
上传分享
举报
下载
原文档
(867.9 KB)
分享
友情链接
GB-T 35101-2017 信息安全技术 智能卡读写机具安全技术要求(EAL4增强).pdf
T-CACM 1021.187—2018 中药材商品规格等级 紫苑.pdf
GB-T 37962-2019 信息安全技术 工业控制系统产品信息安全通用评估准则.pdf
GB-T 26000-2010 膨胀玻化微珠保温隔热砂浆.pdf
易制爆危险化学品治安管理办法.pdf
T-CI 038—2023 污泥脱水调理剂.pdf
思度安全-DSMM-004 数据采集安全管理规范V1.0.pdf
T-CHTS 10031—2021 稳定型天然沥青改性沥青路面技术指南.pdf
GB-T 15852.1-2020 信息技术 安全技术 消息鉴别码 第1部分:采用分组密码的机制.pdf
SL-T 423-2021 河道采砂规划编制与实施监督管理技术规范.pdf
GB-Z 18906-2002 开放式电子图书出版物结构.pdf
ISO 27001 2022中文试译稿v1.0 - 汤季洪 老师.pdf
T-CAME 24—2020 数字化手术室建设标准.pdf
T-CEC 606—2022 电力用直流电源系统蓄电池组远程充放电技术规范.pdf
GB-T 34078.3-2021 基于云计算的电子政务公共平台总体规范 第3部分:服务管理.pdf
GB-T 35986-2018 煤矸石烧失量的测定.pdf
GB-T 23696-2017 证券及相关金融工具 交易所和市场识别码.pdf
个人信息保护与数据合规法律汇编V3.0-垦丁王捷律师团队-KINDING-202212.pdf
GB-T 29101-2012 道路交通信息服务 数据服务质量规范.pdf
GM-T 0044.4-2016 SM9标识密码算法 第4部分:密钥封装机制和公钥加密算法.pdf
1
/
3
16
评价文档
赞助3元 点击下载(867.9 KB)
回到顶部
×
微信扫码支付
3
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。