iso file download
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111233055.3 (22)申请日 2021.10.2 2 (71)申请人 北京达佳互联信息技 术有限公司 地址 100085 北京市海淀区上地西路6号1 幢1层101D1-7 (72)发明人 宛言  (74)专利代理 机构 广州三环 专利商标代理有限 公司 44202 代理人 郝传鑫 贾允 (51)Int.Cl. G06K 9/62(2006.01) G06F 40/279(2020.01) G06N 20/00(2019.01) G06N 3/08(2006.01) (54)发明名称 用于类目识别的模型训练方法、 类目识别方 法及相关装置 (57)摘要 本公开关于用于类目识别的模 型训练方法、 类目识别方法及相关装置, 通过 获取针对第一样 本推荐对象的样本推荐信息, 以该样本推荐信息 作为目标样 本, 确定该第一样 本推荐对象所属的 第一目标类目和第二样本推荐对象所属的第二 目标类目, 并根据类目实体映射信息确定第一目 标类目对应的第一目标实体信息和第二目标类 目对应的第二目标实体信息, 进而根据第一目标 实体信息生成正样本以及根据第二目标实体信 息生成负样本, 并根据目标样本、 正样本和负样 本生成训练三元组, 利用该训练三元组对预设网 络模型进行监督学习得到用于类目识别的目标 模型, 从而使得模型能够进行更好的区分训练, 提高了基于目标模型的类目识别准确性。 权利要求书3页 说明书16页 附图7页 CN 113902028 A 2022.01.07 CN 113902028 A 1.一种用于类目识别的模型训练方法, 其特 征在于, 包括: 获取目标虚拟空间中针对第 一样本推荐对象的样本推荐信 息, 以所述样本推荐信 息作 为目标样本; 所述第一样本推荐对象是所述目标虚拟空间关联的候选样本推荐对象中的任 一候选样本推荐对象, 所述样本推荐信息包括推荐语音对应的文本信息和所述目标虚拟空 间的界面截图信息; 确定所述第 一样本推荐对象所属的第 一目标类目, 以及第 二样本推荐对象所属的第 二 目标类目; 所述第二样本推荐对象是所述候选样本推荐对象中除所述第一样本推荐对象之 外的任一 候选样本推荐对象; 根据类目实体映射信息, 确定所述第一目标类目对应的第一目标实体信息, 以及所述 第二目标类目对应的第二目标实体信息; 所述类目实体映射信息表征类目与实体信息的对 应关系, 所述实体信息包括至少一个关键实体; 根据所述第一目标实体信息生成正样本, 以及根据所述第二目标实体信息生成负样 本; 根据所述目标样本、 所述 正样本和所述负 样本生成训练三元组; 根据所述训练三元组对预设网络模型进行监督学习, 得到目标模型; 所述目标模型用 于推荐对象的类目识别。 2.根据权利要求1所述的用于类目识别的模型训练方法, 其特征在于, 所述方法还包 括: 从推荐对象知识库中获取推荐对象信 息; 所述推荐对象知识库包括推荐对象信 息与类 目的对应关系; 抽取所述推荐对象信 息中的实体, 基于所述推荐对象信 息与类目的对应关系建立所述 实体与所述类目之间的对应关系, 得到初始类目实体对应关系集 合; 将所述初始类目实体对应关系集合中同一类目对应的实体进行聚合, 得到每个类目对 应的实体集 合; 针对每个类目对应的实体集合, 根据 所述实体集合中各实体的出现频次确定所述类目 对应的至少一个关键实体; 根据各所述类目对应的至少一个关键实体, 得到所述类目实体映射信息 。 3.根据权利要求2所述的用于类目识别的模型训练方法, 其特征在于, 所述根据 各所述 类目对应的至少一个关键实体, 得到所述类目实体映射信息包括: 确定各所述类目对应的类目等级; 根据同一类目等级的类目对应的至少一个关键实体, 生成所述类目等级对应的类目实 体映射信息; 根据至少一个所述类目等级对应的类目实体映射信息, 得到所述类目实体映射信息 。 4.根据权利要求3所述的用于类目识别的模型训练方法, 其特征在于, 所述第 一目标类 目包括各所述类目等级对应的第一目标子类目, 所述第二目标类目包括各所述类目等级对 应的第二目标子类目; 所述根据类目实体映射信息, 确定所述第一目标类目对应的第一目标实体信息, 以及 所述第二目标类目对应的第二目标实体信息, 包括: 根据各所述类目等级对应的第 一目标子类目, 从各所述类目等级对应的类目实体映射权 利 要 求 书 1/3 页 2 CN 113902028 A 2信息中确定相应第一目标子类目对应的第一目标子实体信息, 得到至少一个第一目标子实 体信息; 根据各所述类目等级对应的第 二目标子类目, 从各所述类目等级对应的类目实体映射 信息中确定相应第二目标子类目对应的第二目标子实体信息, 得到至少一个第二目标子实 体信息。 5.一种类目识别方法, 其特 征在于, 包括: 在虚拟空间针对推荐对象进行推荐的过程中, 获取 所述推荐的推荐信息; 确定所述虚拟空间关联的候选推荐对象中, 各 所述候选推荐对象所属的类目; 根据类目实体映射信 息和各所述候选推荐对象所属的类目, 确定各所述候选推荐对象 对应的实体信息; 所述类目实体映射信息表征类目与实体信息的对应关系, 所述实体信息 包括至少一个关键实体; 将所述推荐信 息和各所述候选推荐对象对应的实体信 息输入目标模型, 得到所述推荐 信息与各 所述候选推荐对象之间的相似程度; 根据所述推荐信息与各所述候选推荐对象之间的相似程度, 确定目标候选推荐对象; 将所述目标候选对象所属的类目作为所述推荐信息中推荐对象的类目; 其中, 所述目标模型基于权利要求1至4中任一项所述的用于类目识别的模型训练方法 训练得到 。 6.一种用于类目识别的模型训练装置, 其特 征在于, 包括: 样本推荐信 息获取单元, 被配置为执行获取目标虚拟空间中针对第 一样本推荐对象的 样本推荐信息, 以所述样本推荐信息作为 目标样本; 所述第一样本推荐对 象是所述 目标虚 拟空间关联的候选样本推荐对象中的任一候选样本推荐对象, 所述样本推荐信息包括推荐 语音对应的文本信息和所述目标虚拟空间的界面截图信息; 目标类目确定单元, 被配置为执行确定所述第一样本推荐对象所属的第一目标类目, 以及第二样本推荐对象所属的第二目标类目; 所述第二样本推荐对象是所述候选样本推荐 对象中除所述第一样本推荐对象之外的任一 候选样本推荐对象; 目标实体信息确定单元, 被配置为执行根据类目实体映射信息, 确定所述第一目标类 目对应的第一 目标实体信息, 以及所述第二 目标类目对应的第二 目标实体信息; 所述类目 实体映射信息表征类目与实体信息的对应关系, 所述实体信息包括至少一个关键实体; 正负样本生成单元, 被配置为执行根据所述第一目标实体信息生成正样本, 以及根据 所述第二目标实体信息生成负 样本; 训练三元组生成单元, 被配置为执行根据所述目标样本、 所述正样本和所述负样本生 成训练三元组; 训练单元, 被配置为执行根据所述训练三元组对预设网络模型进行监督学习, 得到目 标模型; 所述目标模型用于推荐对象的类目识别。 7.一种类目识别装置, 其特 征在于, 包括: 推荐信息获取单元, 被配置为执行在虚拟空间针对推荐对象进行推荐的过程中, 获取 所述推荐的推荐信息; 候选类目确定单元, 被配置为执行确定所述虚拟空间关联的候选推荐对象中, 各所述 候选推荐对象所属的类目;权 利 要 求 书 2/3 页 3 CN 113902028 A 3

.PDF文档 专利 用于类目识别的模型训练方法、类目识别方法及相关装置

文档预览
中文文档 27 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共27页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 用于类目识别的模型训练方法、类目识别方法及相关装置 第 1 页 专利 用于类目识别的模型训练方法、类目识别方法及相关装置 第 2 页 专利 用于类目识别的模型训练方法、类目识别方法及相关装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-19 02:02:51上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。