iso file download
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111214789.7 (22)申请日 2021.10.19 (71)申请人 深圳前海微众 银行股份有限公司 地址 518027 广东省深圳市前海深港合作 区前湾一路1号A栋201室 (72)发明人 何元钦  (74)专利代理 机构 北京同立钧成知识产权代理 有限公司 1 1205 代理人 刘丹 臧建明 (51)Int.Cl. G06N 20/00(2019.01) G06K 9/62(2006.01) (54)发明名称 模型参数确定方法、 装置、 设备及存 储介质 (57)摘要 本申请公开了一种模型参数确定方法、 装 置、 设备及存储介质, 方法包括: 通过第一客户终 端的第一本地模型对第一训练样本进行处理得 到第一特征向量; 第一本地模型为通过所述第一 训练样本和第二客户终端对应的第二训练样本 联合训练得到的; 接收第二客户终端发送的第二 特征向量, 所述第二特征向量为第二客户终端通 过第二本地模型对第二训练样本进行处理后得 到的; 将第一特征向量输入第一编码器中, 得到 第一编码信息, 并将第二特征向量输入第二编码 器中, 得到第二编码信息; 根据第一编码信息和 第二编码信息, 更新第一本地模型的模型参数。 本申请公开的模型参数确定方法、 装置、 设备及 存储介质能够提高联合模型输出的实际预测信 息的准确性。 权利要求书3页 说明书17页 附图8页 CN 113887739 A 2022.01.04 CN 113887739 A 1.一种模型参数确定方法, 其特 征在于, 应用于第一 客户终端, 所述方法包括: 通过所述第 一客户终端的第 一本地模型对第 一训练样本进行处理得到第 一特征向量; 所述第一本地模型为通过所述第一训练样本和第二客户终端对应的第二训练样本联合训 练得到的; 接收第二客户终端发送的第 二特征向量, 所述第 二特征向量为所述第 二客户终端通过 第二本地模型对第二训练样本进行处 理后得到的; 将所述第一特征向量输入第一编码器中, 得到第一编码信息, 并将所述第二特征向量 输入第二编码器中, 得到第二编码信息; 根据所述第一编码信息和所述第二编码信息, 更新所述第一本地模型的模型参数。 2.根据权利要求1所述的方法, 其特征在于, 所述通过所述第 一客户终端的第 一本地模 型对第一训练样本进行处 理得到第一特 征向量之前, 所述方法还 包括: 通过所述第一客户终端的初始第一本地模型对所述第一训练样本进行处理得到第三 特征向量; 接收第二客户终端发送的第四特征向量, 所述第四特征向量为所述第 二客户终端通过 初始第二本地模型对所述第二训练样本进行处 理后得到的; 根据所述第 三特征向量和所述第四特征向量, 更新所述初始第 一本地模型的模型参数 和所述第一 客户终端的初始分类模型的模型参数, 以得到所述第一本地模型。 3.根据权利要求2所述的方法, 其特征在于, 所述根据所述第 三特征向量和所述第四特 征向量, 更新所述初始第一本地模型的模型参数和所述第一客户终端的初始分类模型的模 型参数, 包括: 将所述第三特征向量和所述第四特征向量输入所述初始分类模型, 得到第一损失信 息; 根据所述第 一损失信 息, 更新所述初始第 一本地模型的模型参数和所述初始分类模型 的模型参数。 4.根据权利要求3所述的方法, 其特征在于, 所述将所述第 三特征向量和所述第四特征 向量输入所述分类模型, 得到第一损失信息, 包括: 将所述第三特 征向量和所述第四特 征向量进行拼接, 得到拼接后的特 征向量; 将拼接后的特 征向量输入所述初始分类模型, 得到预测信息; 获取所述第一训练样本对应的标记信息; 根据所述预测信息和所述标记信息, 确定所述第一损失信息 。 5.根据权利要求3所述的方法, 其特征在于, 所述根据所述第一损 失信息, 更新所述初 始第一本地模型的模型参数和所述初始分类模型的模型参数之后, 所述方法还 包括: 判断更新后的初始分类模型和更新后的初始第一本地模型 是否均处于收敛状态; 若更新后的分类模型和更新后的初始第 一本地模型均处于收敛状态, 则将所述更新后 的初始分类模型确定为模型训练的最终结果。 6.根据权利要求 4所述的方法, 其特 征在于, 所述方法还 包括: 根据所述第 一损失信 息, 控制所述第 二客户终端更新所述初始第 二本地模型的模型参 数, 以得到所述第二本地模型。 7.根据权利要求6所述的方法, 其特征在于, 所述根据所述第一损 失信息, 控制所述第权 利 要 求 书 1/3 页 2 CN 113887739 A 2二客户终端更新所述初始第二本地模型的模型参数, 包括: 根据所述第一损失信息, 确定所述第二特 征向量对应的梯度信息; 将所述梯度信 息发送给所述第 二客户终端, 所述梯度信 息用于指示所述第 二客户终端 根据所述梯度信息更新所述初始第二本地模型的模型参数。 8.根据权利要求1 ‑7中任一项所述的方法, 其特征在于, 所述根据 所述第一编码信 息和 所述第二编码信息, 更新所述第一本地模型的模型参数, 包括: 根据所述第一编码信息和所述第二编码信息, 确定第二损失信息; 根据所述第二损失信息, 更新所述第一本地模型的模型参数。 9.根据权利要求8所述的方法, 其特征在于, 所述根据所述第二损 失信息, 更新所述第 一本地模型的模型参数, 包括: 根据所述第二损 失信息, 更新所述第一编码器的模型参数、 所述第二编码器的模型参 数和所述第一本地模型 的模型参数, 得到第一更新编码器、 第二更新编码器和第一更新本 地模型; 判断所述第 一更新编码器、 所述第 二更新编码器和所述第 一更新本地模型是否均处于 收敛状态; 若所述第一更新编码器、 所述第 二更新编码器和所述第 一更新本地模型均处于收敛状 态, 则将所述第一更新本地模型确定为模型训练的最终结果。 10.根据权利要求9所述的方法, 其特 征在于, 所述方法还 包括: 若所述第一更新编码器、 所述第 二更新编码器和所述第 一更新本地模型中存在至少一 个未处于收敛状态, 则重复执行如下步骤, 直至所述第一更新编码 器、 所述第二更新编 码器 和所述第一更新本地模型均收敛: 分别通过所述第一更新本地模型和第二更新本地模型重新获取第三特征向量和第四 特征向量, 并根据重新获取 的第三特征向量和重新获取 的第四特征向量, 继续更新第一更 新本地模型 的模型参数, 其中, 所述第二更新本地模型为根据所述第二损失信息控制所述 第二客户终端对所述第二本地模型进行 更新得到 。 11.一种模型参数确定装置, 其特征在于, 应用于第 一客户终端, 所述装置包括: 处理模 块、 接收模块和更新模块; 所述处理模块, 用于通过所述第 一客户终端的第 一本地模型对第 一训练样本进行处理 得到第一特征向量; 所述第一本地模型为通过所述第一训练样本和第二客户终端对应的第 二训练样本联合训练得到的; 所述接收模块, 用于接收第二客户终端发送的第二特征向量, 所述第二特征向量为所 述第二客户终端通过第二本地模型对第二训练样本进行处 理后得到的; 所述处理模块, 还用于将所述第 一特征向量输入第 一编码器中, 得到第 一编码信 息, 并 将所述第二特 征向量输入第二编码器中, 得到第二编码信息; 所述更新模块, 用于根据所述第一编码信息和所述第二编码信息, 更新所述第一本地 模型的模型参数。 12.一种模型参数确定设备, 其特征在于, 所述模型参数确定设备包括: 存储器、 处理器 及存储在所述存储器上并可在所述处理器上运行的模型参数确定程序, 所述模型参数确定 程序被所述处理器执行时实现如权利要求1至10中任一项所述的模型参数确定方法的步权 利 要 求 书 2/3 页 3 CN 113887739 A 3

.PDF文档 专利 模型参数确定方法、装置、设备及存储介质

文档预览
中文文档 29 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共29页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 模型参数确定方法、装置、设备及存储介质 第 1 页 专利 模型参数确定方法、装置、设备及存储介质 第 2 页 专利 模型参数确定方法、装置、设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-19 02:02:40上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。