iso file download
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111162158.5 (22)申请日 2021.09.3 0 (71)申请人 腾讯科技 (深圳) 有限公司 地址 518057 广东省深圳市南 山区高新区 科技中一路腾讯大厦3 5层 (72)发明人 王泽元 张倩汶 闫昭 (74)专利代理 机构 北京派特恩知识产权代理有 限公司 1 1270 代理人 刘星雨 张颖玲 (51)Int.Cl. G06F 16/332(2019.01) G06F 16/33(2019.01) G06F 16/35(2019.01) G06F 40/126(2020.01) G06F 40/194(2020.01)G06F 40/295(2020.01) G06F 40/30(2020.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06N 20/00(2019.01) (54)发明名称 自然语言数据查询方法、 装置、 电子设备及 存储介质 (57)摘要 本申请提供了一种自然语 言数据查询方法、 装置、 电子设备及存储介质, 应用于云技术、 人工 智能、 智慧交通和车载等各种场景。 方法包括: 根 据预设目标领域的预设实体资源, 对自然语言查 询文本进行实体提取, 得到目标实体集合; 通过 构建目标实体集合中每个目标实体与预设数据 表中列值的映射关系, 得到每个目标实体对应的 映射列值; 基于目标实体集合、 每个目标实体对 应的映射列值与预设数据表中的列名, 对自然语 言查询文本进行结构化查询语句预测, 得到待查 询语句; 根据待查询语句在预设数据表中进行查 询, 得到自然语言文本对应的查询结果。 通过本 申请, 能够提高使用自然语言进行数据查询的准 确性。 权利要求书3页 说明书19页 附图8页 CN 114281957 A 2022.04.05 CN 114281957 A 1.一种自然语言数据查询方法, 其特 征在于, 包括: 根据预设目标领域的预设实体资源, 对自然语言查询文本进行实体提取, 得到目标实 体集合; 通过构建所述目标实体集合中每个目标实体与 预设数据表中列值的映射关系, 得到所 述每个目标实体对应的映射列值; 基于所述目标实体集合、 所述每个目标实体对应的映射列值与 所述预设数据表中的列 名, 对所述自然语言查询文本进行 结构化查询语句预测, 得到待查询语句; 根据所述待查询语句在所述预设数据表中进行查询, 得到所述自然语言文本对应的查 询结果。 2.根据权利要求1所述的方法, 其特征在于, 所述预设实体资源包括: 预设实体库与预 设实体识别模型中的至少之一; 所述预设实体识别模型为利用所述预设目标领域中的实体 数据训练得到的网络模型; 所述根据预设目标领域的预设实体资源, 对自然语言查询文本 进行实体提取, 得到目标实体集 合, 包括以下至少之一: 将所述预设实体库中的实体在所述自然语言查询文本 中进行匹配, 在所述自然语言查 询文本中存在所述实体的情况 下, 将所述实体作为目标实体, 从而得到目标实体集 合; 通过所述预设实体识别模型, 对所述自然语言查询文本进行实体识别与提取, 得到所 述目标实体集 合。 3.根据权利要求2所述的方法, 其特征在于, 所述通过构建所述目标实体集合中每个目 标实体与预设数据表中列值的映射关系, 得到所述每个目标实体对应的映射列值, 包括以 下至少之一: 对于从所述预设实体库中得到的目标实体, 根据预设的实体与列值之间的对应关系, 得到所述每个目标实体对应的映射列值; 所述预设的实体与列值之 间的对应关系为预先构 建的所述预设实体库中的每 个实体与所述预设数据表中列值的对应关系; 对于根据 所述预设实体识别模型得到的目标实体, 计算所述每个目标实体与 所述预设 数据表中的每个列值之 间的第一相似度, 并基于所述第一相似度得到所述每个目标实体对 应的映射列值。 4.根据权利要求1 ‑3任一项所述方法, 其特征在于, 所述基于所述目标实体集合、 所述 每个目标实体对应的映射列值与所述预设数据表中的列名, 对所述自然语言查询文本进 行 结构化查询语句预测, 得到待查询语句, 包括: 通过对所述自然语言查询文本与 所述每个目标实体进行语义编解码处理, 得到所述自 然语言查询文本对应的语句向量表示, 以及所述每 个目标实体的实体向量表示; 从所述预设数据表的每列 数据中选取目标列值, 并对所述每列 数据的列名与 所述目标 列值分别进行语义编解码处 理, 得到列名向量表示与目标列值向量表示; 结合所述列名向量表示与所述目标列值向量表示, 得到所述每列数据的列向量表示; 根据所述语句向量表示、 所述每个目标实体的实体向量表示、 以及所述每列数据的列 向量表示, 结合所述每个目标实体对应的映射列值对所述自然语言查询文本进行结构化查 询语句预测, 得到所述待查询语句。 5.根据权利要求4所述的方法, 其特征在于, 所述根据所述语句向量表示、 所述每个目 标实体的实体向量表示、 以及所述每列数据的列向量表示, 结合所述每个目标实体对应的权 利 要 求 书 1/3 页 2 CN 114281957 A 2映射列值对所述自然语言查询文本进行 结构化查询语句预测, 得到所述待查询语句, 包括: 基于所述语句向量表示与 所述每列 数据的列向量表示, 进行所述结构化查询语句预测 中的查询字段 预测, 得到查询字段 预测结果; 基于所述语句向量表示、 所述每个目标实体的实体向量表示、 以及所述每列数据的列 向量表示, 结合所述每个目标实体对应的映射列值, 进行所述结构化查询语句预测中的条 件字段预测, 得到条件字段 预测结果; 结合所述 查询字段 预测结果与所述条件字段 预测结果, 得到所述待查询语句。 6.根据权利要求5所述的方法, 其特征在于, 所述基于所述语句向量表示与 所述每列 数 据的列向量表示, 进行所述结构化查询语句预测中的查询 字段预测, 得到查询 字段预测结 果, 包括: 对所述语句向量表示进行至少一种预设查询数量的分类预测, 得到所述语句向量表示 对应于每种预设查询数量的第一 概率; 将最高的第 一概率对应的预设查询数量, 作为所述结构化查询语句对应的查询字段数 量; 根据所述列向量表示, 对所述预设数据表中的每列数据进行查询目标预测, 得到所述 每列数据为 查询目标的第二 概率; 根据所述第 二概率从高到低的次序, 从所述每列 数据中选取前查询字段数量个列 数据 作为目标列数据, 并将目标列数据的列名作为目标查询字段, 得到目标查询字段集 合; 基于所述目标查询字段集 合, 得到所述 查询字段 预测结果。 7.根据权利要求6所述的方法, 其特征在于, 所述基于所述目标查询字段集合, 得到所 述查询字段 预测结果, 包括: 对所述目标查询字段集合中每个目标查询字段对应的列向量表示进行至少一种预设 聚合函数的分类预测, 得到所述每 个目标查询字段对应于每种预设聚合 函数的第三 概率; 将最高的第 三概率对应的预设聚合函数, 作为所述每个目标查询字段对应的目标聚合 函数; 根据所述每个目标查询字段对应的目标聚合函数, 对所述每个目标查询字段进行结 合, 得到所述 查询字段 预测结果。 8.根据权利要求5所述的方法, 其特征在于, 所述基于所述语句向量表示、 所述每个目 标实体的实体向量表示、 以及所述每列数据的列向量表示, 结合所述每个目标实体对应的 映射列值, 进行所述结构化查询语句预测中的条件字段预测, 得到条件字段预测结果, 包 括: 对所述语句向量表示进行至少一种预设条件数量的分类预测, 得到所述语句向量表示 对应于每种预设条件数量的第四概 率; 将最高的第四概 率对应的预设条件数量, 作为所述待查询语句对应的条件字段 数量; 根据所述条件字段数量, 从通过对所述每个目标实体的实体向量表示与所述列向量表 示进行匹配得到的对应关系中, 得到目标实体与 列数据的匹配关系; 根据所述每个目标实体对应的映射列值, 对所述匹配关系中的目标实体进行更新, 得 到列数据与映射列值的条件匹配关系; 针对所述条件匹配关系, 进行至少一种预设条件操作符预测, 得到条件匹配关系对应权 利 要 求 书 2/3 页 3 CN 114281957 A 3
专利 自然语言数据查询方法、装置、电子设备及存储介质
文档预览
中文文档
31 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助3元下载(无需注册)
温馨提示:本文档共31页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助3元下载
本文档由 人生无常 于
2024-03-19 02:03:01
上传分享
举报
下载
原文档
(1.5 MB)
分享
友情链接
T-ZZB 0398—2018 环保节能舒适电热油汀.pdf
青藤云安全 威胁狩猎实践指南.pdf
GB-T 36465-2018 网络终端操作系统总体技术要求.pdf
GA-T 912-2018 信息安全技术 数据泄露防护产品安全技术要求.pdf
信通院 2023大模型落地应用案例集 --大模型测试验证与协同创新中心-2023.pdf
JR-T0197-2020 金融数据安全 数据安全分级指南.pdf
GB-T 19345.1-2017 非晶纳米晶合金 第1部分:铁基非晶软磁合金带材.pdf
GB-T 42654-2023 铜及铜合金海水冲刷腐蚀试验方法.pdf
法律法规 南通市科技创新促进条例2023-12-11.pdf
GM-T 0076-2019 银行卡信息系统密码应用技术要求.pdf
GM-T 0010-2023 SM2密码算法加密签名消息语法规范.pdf
CSA 零信任安全理念.pdf
专利 一种用于冲压模的插入式组合散热装置.PDF
T-CIECCPA 009—2023 电动汽车退役动力蓄电池回收利用拆解 技术规范.pdf
DB32-T 4284-2022 居民住宅二次供水工程技术规程 江苏省.pdf
GB-T 17116.3-2018 管道支吊架 第3部分:中间连接件和建筑结构连接件.pdf
GA 1551.5-2019 石油石化系统治安反恐防范要求 第5部分:运输企业.pdf
GB-T 25744-2010 钢件渗碳淬火回火金相检验.pdf
T-CSES 41—2021 二氧化碳捕集利用与封存术语.pdf
GB-T 30760-2024 水泥窑协同处置固体废物技术规范.pdf
1
/
3
31
评价文档
赞助3元 点击下载(1.5 MB)
回到顶部
×
微信扫码支付
3
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。