iso file download
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111232526.9 (22)申请日 2021.10.2 2 (71)申请人 中国人民解 放军战略支援 部队信息 工程大学 地址 450000 河南省郑州市高新区科 学大 道62号 (72)发明人 尹美娟 胡红卫 刘晓楠 伍润民  刘威 罗向阳 颜志豪  (74)专利代理 机构 郑州大通专利商标代理有限 公司 41111 代理人 周艳巧 (51)Int.Cl. G06F 40/279(2020.01) G06F 40/126(2020.01) G06N 20/00(2019.01) (54)发明名称 基于关系导向的实体关系联合抽取方法及 系统 (57)摘要 本发明属于自然语 言处理技术领域, 特别涉 及一种基于关系导向的实体关系联合抽取方法 及系统, 对目标文本中句子进行编码, 获取目标 文本中句子向量表示; 针对句子向量表示, 利用 关系抽取模块抽取目标文本中所包含的关系类 型; 将抽取的关系类型作为先验知识与目标文本 句子中词向量表示进行融合, 利用实体识别模块 来识别目标文本中与抽取的关系类型对应的实 体。 本发明能够减少对无关实体的关注, 避免抽 取冗余实体, 进而对识别出的多个 关系类型分别 识别其对应的实体对, 解决实体重叠问题, 最终 抽取出句子中所包含的全部实体关系三元组, 提 升实体关系识别准确度, 便 于实际场景应用。 权利要求书2页 说明书10页 附图3页 CN 113887211 A 2022.01.04 CN 113887211 A 1.一种基于关系导向的实体关系联合抽取 方法, 其特 征在于, 包 含如下内容: 对目标文本中句子进行编码, 获取目标文本中句子向量表示; 针对句子向量表示, 利用关系抽取模块抽取目标文本中所包 含的关系类型; 将抽取的关系类型作为先验知识与目标文本句子中词向量表示进行融合, 利用实体识 别模块来识别目标文本中与抽取的关系类型对应的实体。 2.根据权利要求1所述的基于关系导向的实体关系联合抽取方法, 其特征在于, 采用预 训练的BERT模型对目标文本中句子进行编码, 获取目标文本中各单词嵌入词向量, 并通过 捕捉句子特 征生成句子上 下文的向量表示。 3.根据权利要求2所述的基于关系导向的实体关系联合抽取方法, 其特征在于, 在目标 文本中句子句首添加分类标识符, 将添加分类标识符 的句子作为BERT模型输入, 通过BERT 模型进行编码, 获取输出的句子向量表示。 4.根据权利要求1所述的基于关系导向的实体关系联合抽取方法, 其特征在于, 关系抽 取模块中, 通过采用sigmoid函数将关系抽取建模为多标签二元分类任务, 来识别并输出句 子向量表示中的多种关系类型。 5.根据权利要求4所述的基于关系导向的实体关系联合抽取方法, 其特征在于, 多标签 二元分类任务表示为: pr=σ(Wr·hcls+br), 其中, pr为输出的关系类型标签, Wr∈RN×d, N为总 关系类型数量, d为句 子向量表示维度大小, br为偏置向量, σ 表示sigmoid函数, hcls为句子 向量。 6.根据权利要求5所述的基于关系导向的实体关系联合抽取方法, 其特征在于, 关系抽 取模块损失函数采用二分类交叉熵函数, 该二分类交叉熵函数表示 为: 其中, yi为真实关系类型 标签。 7.根据权利要求1或4或5或6所述的基于关系导向的实体关系联合抽取方法, 其特征在 于, 针对抽取的多种关系类型(r1,r2,...,rm), m为抽取的关系数量, 根据索引利用查表法进 行编码, 获取关系类型编 码向量, 将句子中词向量表示和关系类型编 码向量叠加融合, 以利 用实体识别模块输出与抽取的关系类型对应的实体。 8.根据权利要求1所述的基于关系导向的实体关系联合抽取方法, 其特征在于, 将抽取 的关系类型和目标文本句 子中词向量表示叠加融合, 作为实体识别模块输入向量, 基于抽 取的关系类型分别采用二进制指 针标记关系类型对应的实体位置, 依据实体位置获取关系 类型对应的实体三元组(头实体, 关系, 尾实体)。 9.根据权利要求8所述的基于关系导向的实体关系联合抽取方法, 其特征在于, 标记实 体位置中, 采用两个相同二元分类器对头实体和尾实体进行解码, 其中一个分类器标记实 体开始位置, 另一个分类器标记实体结束位置, 对输入向量每个单词分配一个二进制标签 并检测单词作为实体开始和结束位置的概率, 并依据就近原则, 选取与开始位置最近距离 的结束位置来 生成关系类型对应的实体。 10.一种基于关系导向的实体关系联合抽取系统, 其特征在于, 包含: 句子编码模块、 关 系抽取模块及实体识别模块, 其中, 句子编码模块, 用于对目标文本中句子进行编码, 获取目标文本中句子向量表示;权 利 要 求 书 1/2 页 2 CN 113887211 A 2关系抽取模块, 用于针对句子向量表示, 利用关系抽取模块抽取目标文本中所包含的 关系类型; 实体识别模块, 用于将抽取的关系类型作为先验知识与目标文本句子中词向量表示进 行融合, 利用实体识别模块 来识别目标文本中与抽取的关系类型对应的实体。权 利 要 求 书 2/2 页 3 CN 113887211 A 3

.PDF文档 专利 基于关系导向的实体关系联合抽取方法及系统

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于关系导向的实体关系联合抽取方法及系统 第 1 页 专利 基于关系导向的实体关系联合抽取方法及系统 第 2 页 专利 基于关系导向的实体关系联合抽取方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-19 02:01:45上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。