iso file download
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111196559.2 (22)申请日 2021.10.14 (71)申请人 中国电信股份有限公司 地址 100033 北京市西城区金融大街31号 (72)发明人 陈康 付华峥 陈翀  (74)专利代理 机构 北京律智知识产权代理有限 公司 11438 代理人 王辉 阚梓瑄 (51)Int.Cl. G06F 21/62(2013.01) G06N 20/00(2019.01) H04W 12/03(2021.01) H04W 12/041(2021.01) (54)发明名称 推荐模型的训练方法、 信息推荐 方法、 装置、 设备及介质 (57)摘要 本公开涉及一种推荐模型的训练方法及装 置、 信息推荐方法及装置、 电子设备及计算机可 读介质, 属于机器学习技术领域。 该推荐模型的 训练方法包括: 将所有终端划分为终端对并生成 密钥; 对各个终端的特征进行分箱后计算特征的 统计信息; 根据特征统计信息与终端的密钥, 得 到终端中每个特征的加密统计信息以及各个特 征的总体统计信息; 将训练样 本集合作为决策树 模型中的节 点, 并根据总体统计信息确定目标分 裂点; 根据目标分裂点对决策树进行分裂后, 重 新计算训练样本集合中各个特征的统计信息并 确定下一目标分裂点, 直到满足预设条件时停止 迭代, 得到终端的推荐模型。 本公开通过在模型 训练过程中对终端的特征统计信息进行加密, 可 以保护用户隐私。 权利要求书2页 说明书11页 附图4页 CN 113946861 A 2022.01.18 CN 113946861 A 1.一种推荐模型的训练方法, 其特 征在于, 包括: 将所有终端划分为两两一对的终端对, 并生成各个所述终端对应的密钥, 其中, 所述终 端对中的两个终端的密钥互为相反数; 获取各个所述终端的用户行为数据, 根据 所述用户行为数据得到各个所述终端中的特 征, 将所述终端中的特征作为所述终端对应的训练样本集合, 并对所述特征进行分箱后计 算所述特 征的统计信息; 根据所述终端中每个特征的统计信 息与所述终端的密钥, 得到所述终端中每个特征的 加密统计信息, 并根据所有所述 终端中每个特征的加密统计信息得到各个所述特征对应的 总体统计信息; 将所述训练样本集合作为决策树模型中的节点, 并根据 所述总体统计信 息确定所述决 策树模型的目标分裂点, 其中, 所述目标分裂点 为本次分裂使用的特 征以及对应的特 征值; 根据所述目标分裂点对所述决策树模型中的节点进行分裂后, 重新计算所述训练样本 集合中各个特征的统计信息并确定下一目标分裂点, 直到所述终端中的特征满足预设条件 时停止迭代, 得到所述终端的推荐模型。 2.根据权利要求1所述的推荐模型的训练方法, 其特征在于, 所述生成各个所述终端对 应的密钥, 其中, 所述终端对中的两个终端的密钥互为相反数, 包括: 生成所述终端对中的两个终端对应的元组数据, 所述元组数据中包含所述终端对中的 两个终端的密钥正负标识; 根据所述终端对应的元组数据生成所述终端对应的初始密钥, 并根据 所述初始密钥和 所述密钥正负标识得到所述终端对应的密钥。 3.根据权利要求1所述的推荐模型的训练方法, 其特征在于, 所述对所述特征进行分箱 后计算所述特 征的统计信息, 包括: 获取各个所述终端中每个特征的特征值, 并根据所有所述终端中每个特征的特征值, 确定各个所述特 征的综合 最大值和综合 最小值; 根据各个所述特征的综合最大值和综合最小值对所述特征进行分箱, 得到各个所述特 征的综合分箱结果; 根据各个所述特征的综合分箱结果得到各个所述终端的终端分箱结果, 并根据 所述终 端分箱结果计算所述终端中所述特 征的统计信息 。 4.根据权利要求3所述的推荐模型的训练方法, 其特征在于, 所述根据 所有所述终端中 每个特征的特征值, 确定各个所述特 征的综合 最大值和综合 最小值, 包括: 获取各个所述终端中每个特征的特征值, 并根据 所述特征值得到所述终端中每个所述 特征对应的特 征值对; 根据所有所述终端中每个所述特征对应的特征值对, 确定各个所述特征的综合最大值 和综合最小值。 5.根据权利要求4所述的推荐模型的训练方法, 其特征在于, 所述根据 所述特征值得到 所述终端中每 个所述特 征对应的特 征值对, 包括: 根据所述终端中每个所述特征的特征值, 得到所述终端中每个所述特征的终端最大值 和终端最小值; 根据所述特征的取值 区间得到所述特征的干扰参数, 并根据所述特征的终端最大值和权 利 要 求 书 1/2 页 2 CN 113946861 A 2终端最小值以及所述干扰参数 得到所述特 征对应的特 征值对。 6.一种信息推荐方法, 其特 征在于, 包括: 获取终端的用户行为数据, 并将所述终端的用户行为数据输入所述终端的推荐模型 中, 其中, 所述推荐模型是通过如权利要求 1‑5中任意一项 所述的推荐模型的训练方法得到 的; 根据所述终端的推荐模型的输出 结果, 得到所述终端对应的推荐信息 。 7.一种推荐模型的训练装置, 其特 征在于, 包括: 终端密钥生成模块, 用于将所有终端划分为两两一对的终端对, 并生成各个所述终端 对应的密钥, 其中, 所述终端对中的两个终端的密钥互为相反数; 统计信息确定模块, 用于获取各个所述终端的用户行为数据, 根据所述用户行为数据 得到各个所述终端中的特征, 将所述终端中的特征作为所述终端对应的训练样本集合, 并 对所述特 征进行分箱后计算所述特 征的统计信息; 统计信息加密模块, 用于根据所述终端中每个特征的统计信息与所述终端的密钥, 得 到所述终端中每个特征的加密统计信息, 并根据所有 所述终端中每个特征的加密统计信息 得到各个所述特 征对应的总体统计信息; 分裂节点确定模块, 用于将所述训练样本集合作为决策树模型中的节点, 并根据所述 总体统计信息确定所述决策树模型 的目标分裂点, 其中, 所述 目标分裂点为本次分裂使用 的特征以及对应的特 征值; 推荐模型迭代模块, 用于根据所述目标分裂点对所述决策树模型中的节点进行分裂 后, 重新计算所述训练样本集合中各个特征 的统计信息并确定下一 目标分裂点, 直到所述 终端中的特 征满足预设条件时停止迭代, 得到所述终端的推荐模型。 8.一种信息推荐装置, 其特 征在于, 包括: 用户信息获取模块, 用于获取终端的用户行为数据, 并将所述终端的用户行为数据输 入所述终端的推荐模 型中, 其中, 所述推荐模型是通过如权利要求7中所述的推荐模型的训 练装置得到的; 推荐信息确定模块, 用于根据所述终端的推荐模型的输出结果, 得到所述终端对应的 推荐信息 。 9.一种电子设备, 其特 征在于, 包括: 处理器; 以及 存储器, 用于存储一个或多个程序, 当所述一个或多个程序被所述处理器执行时, 使得 所述处理器实现如权利要求 1至5中任一项 所述的推荐模型的训练方法或权利要求6所述的 信息推荐方法。 10.一种计算机可读介质, 其上存储有计算机程序, 其特征在于, 所述程序被处理器执 行时实现如权利要求1至5中任一项 所述的推荐模 型的训练方法或权利要求6所述的信息推 荐方法。权 利 要 求 书 2/2 页 3 CN 113946861 A 3

.PDF文档 专利 推荐模型的训练方法、信息推荐方法、装置、设备及介质

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 推荐模型的训练方法、信息推荐方法、装置、设备及介质 第 1 页 专利 推荐模型的训练方法、信息推荐方法、装置、设备及介质 第 2 页 专利 推荐模型的训练方法、信息推荐方法、装置、设备及介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-19 02:02:25上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。