iso file download
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111228436.2 (22)申请日 2021.10.21 (71)申请人 支付宝 (杭州) 信息技 术有限公司 地址 310000 浙江省杭州市西湖区西溪路 556号8层B段801-1 1 (72)发明人 郑龙飞 陈超超 王力 张本宇 (74)专利代理 机构 北京亿腾知识产权代理事务 所(普通合伙) 11309 代理人 陈霁 周良玉 (51)Int.Cl. G06N 20/00(2019.01) G06N 3/08(2006.01) G06F 21/60(2013.01) G06F 21/62(2013.01) (54)发明名称 联合更新模型的方法、 装置及系统 (57)摘要 本说明书实施例提供一种联合更新模型的 方法、 装置及系统, 基于训练成员的数据构成水 平切分, 且模 型在训练成员和服务方切分成两部 分的情形, 由服务方将服务方切分得到的子模型 配置为多个可同步聚合的子模型。 这样, 在单个 训练周期, 服务方配置的多个可同步聚合的子模 型可以与各个训练成员一一对应, 单个训练成员 上的子模型和服务方的单个子模型串联相当于 联合训练的模 型。 而服务方在各个子模 型中待定 参数的梯度或待定参数更新完成后, 可以对待定 参数的梯度或待定参数进行同步, 以聚合为服务 方切分得到的子模型。 如此, 可 以大大减少各个 训练成员之间计算的相互等待时间, 提高联合训 练模型的效率。 权利要求书3页 说明书11页 附图4页 CN 113887740 A 2022.01.04 CN 113887740 A 1.一种联合更新模型的方法, 用于服务方和k个训练成员联合训练模型W的过程, 所述 模型W包括所述k个训练成员中的训练成员i上的子模型Wci以及服务方的子模型Ws, 子模型 Ws由服务方的k个子模型WS1至W Sk以同步方式聚合确定, 子模型WS1至WSk与k个训练成员一一 对应, 训练成员i持有样本数据Xi; 在当前训练周期, 所述方法包括: 各个训练成员分别与服务方进行以下交互操作, 从而更新本地的各个待定参数: 训练 成员i利用本地子模型Wci处理本地样本数据Xi, 并将得到的中间结果Li发送至服务方; 服务 方基于子模型WSi对中间结果Li的处理, 确定子模型WSi中各个待定参数的梯度, 并向相应训 练成员i反馈中间结果Li的梯度数据Gi, 其中, 子模型WSi中各个待定参数的梯度用于更新相 应的各个待同步参数, 单个待同步参数为相应待定参数或其梯度; 训练成员i根据梯度数据 Gi, 更新本地的各个待定参数; 服务方在基于各个子模型WS1至W Sk中待定参数的梯度, 完成本轮次各个子模型WS1至W Sk各自的待同步参数的更新的情况下, 对子模型WS1至W Sk中的待同步参数进行同步以确 定 聚合的子模型Ws。 2.根据权利要求1所述的方法, 其中, 训练成员i还持有样本数据Xi的标签数据Yi; 所述 服务方基于 子模型WSi对中间结果 Li的处理, 确定子模型WSi中各个待定参数的梯度包括: 服务方基于子模型WSi对中间结果Li的处理, 得到关于样本数据Xi的预测结果yi并反馈 给训练成员i; 训练成员i基于预测结果yi与标签数据Yi的对比, 确定模型损失, 并将模型损失针对预 测结果yi的梯度反馈 至服务方; 服务方基于训练成员i的反馈更新子模型WSi中各个待定参数的梯度。 3.根据权利要求1所述 的方法, 其中, 训练成员i持有样本数据Xi的标签数据Yi, 以及子 模型W'ci; 所述服务方基于子模型WSi对中间结果Li的处理, 确定子模型WSi中各个待定参数 的梯度包括: 服务方基于子模型WSi对中间结果Li的处理, 得到关于样本数据Xi进一步的中间结果Lsi 并反馈给训练成员i; 训练成员i基于子模型W'ci对中间结果Lsi的处理得到预测结果yi, 并将预测结果yi与标 签数据Yi进行对比, 从而确 定模型损失, 以向服务方反馈模型损失针对中间结果Lsi的梯度 数据; 服务方基于模型损失针对中间结果Lsi的梯度数据更新子模型WSi中各个待定参数的梯 度。 4.根据权利要求1所述的方法, 其中, 所述对子模型WS1至W Sk中的待同步参数进行同步 以确定聚合的子模型Ws包括: 利用加权平均方式对子模型WS1至W Sk中各个待同步参数进行同步, 其中, 单个子模型 WSi中各个待同步 参数的加权 权重与相应训练成员i使用的样本数 数据Xi的条数ni正相关; 利用各个待同步 参数的同步 值, 确定子模型Ws中的各个待定参数。 5.根据权利要求4所述的方法, 其中, 样本数据Xi的条数ni由服务方对中间结果Li的检 测确定。 6.一种联合更新模型的方法, 由和k个训练成员联合训练模型的服务方执行, 所述模型 W包括所述k个训练成员中的训练成员i上的子模型Wci以及服务方的子模型Ws, 子模型Ws由权 利 要 求 书 1/3 页 2 CN 113887740 A 2服务方的k个子模型WS1至W Sk以同步方式聚合确定, 子模型WS1至W Sk与k个训练成员一一对 应; 在当前训练周期, 所述方法包括: 针对单个子模型WSi执行以下更新操作: 从相应训练成员i接收其利用本地子模型Wci处 理本地样本数据Xi得到的中间结果Li; 基于子模型WSi对中间结果Li的处理, 确定子模型WSi 的各个待定参数 的梯度数据, 以更新相应的各个待同步参数, 单个待同步参数为相应待定 参数或其梯度; 向训练成员i反馈相应中间结果Li的梯度数据Gi, 以供训练成员i根据 梯度数 据Gi更新本地子模型Wci的待定参数; 在针对各个子模型WS1至W Sk均完成本轮次 的更新操作的情况下, 对子模型WS1至WSk中的 待同步参数进行同步以确定聚合的子模型Ws。 7.根据权利要求6所述的方法, 其中, 所述基于子模型WSi对相应中间结果Li的处理, 确 定子模型WSi的各个待定参数的梯度数据包括: 基于子模型WSi对中间结果Li的处理, 得到关于相应样本数据的预测结果yi并反馈给训 练成员i, 以供训练成员i基于预测结果yi与相应标签数据Yi的对比, 确定模型损失针对预测 结果yi的梯度反馈 至服务方; 基于模型损失针对预测结果yi的梯度确定相应子模型WSi中各个待定参数的梯度。 8.根据权利要求6所述的方法, 其中, 所述对子模型WS1至W Sk中的待同步参数进行同步 以确定聚合的子模型Ws包括: 利用加权平均方式对各个子模型WS1至W Sk中各个待同步参数进行同步, 其中, 单个子模 型WSi中各个待同步参数的加权权重与相应训练成员i使用的样本数数据Xi的条数ni正相 关; 利用各个待同步 参数的同步 值, 确定子模型Ws中的各个待定参数。 9.根据权利要求8所述的方法, 其中, 样本数据Xi的条数ni由服务方对中间结果Li的检 测确定。 10.一种联合更新模型的方法, 由和k个训练成员联合训练模型W的服务方执行, 所述模 型W包括所述k个训练成员中的训练成员i上的子模型Wci以及服务方的子模型Ws, 子模型Ws 由服务方的k个子模型WS1至W Sk以同步方式聚合确定; 在当前训练周期, 所述方法包括: 接收训练成员i利用本地子模型W ci处理本地样本数据Xi得到的中间结果 Li; 将中间结果Li分配给子模型W Sj, 并基于子模型W Sj对中间结果Li的处理, 确定子模型 WSj中各个待定参数的梯度 数据及中间结果Li的梯度数据, 其中, 子模型WSi中各个待定参数 的梯度用于更新相应的各个待同步 参数, 单个待同步 参数为相应待定参数或其梯度; 向训练成员i反馈中间结果Li的梯度数据, 以供训练成员i根据中间结果Li的梯度数据 更新本地子模型Wci的待定参数; 在基于各个子模型WS1至W Sk中待定参数的梯度数据, 完成本轮次各个子模型WS1至W Sk 各自的待同步参数的更新的情 况下, 对子模型WS1至W Sk中的待定参数进行同步以确定聚合 的子模型Ws。 11.一种联合更新模型的系统, 包括联合训练模型W的服务方和k个训练成员, 其中, 所 述模型W包括所述k个训练成员中的训练成员i上的子模型Wci以及服务方的子模型Ws, 子模 型Ws由服务方的k个子模型WS1至W Sk以同步方式聚合确定, 子模型WS1至WSk与k个训练成员一 一对应, 训练成员i持有样本数据Xi; 其中, 在单个训练周期:权 利 要 求 书 2/3 页 3 CN 113887740 A 3
专利 联合更新模型的方法、装置及系统
文档预览
中文文档
19 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助3元下载(无需注册)
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助3元下载
本文档由 人生无常 于
2024-03-19 02:02:58
上传分享
举报
下载
原文档
(834.7 KB)
分享
友情链接
DB13-T 2573-2017 养老机构安宁疗护服务规范 河北省.pdf
GW0013-2017 国家电子政务外网 政务云安全要求.pdf
GB-T 40753.4-2024 供应链安全管理体系 ISO 28000实施指南 第4部分:以符合GB-T 38702为管理目标实施ISO 28000的附加特定指南.pdf
GB-T 34969-2017 彩色激光打印机测试版.pdf
DB36-T 1774-2023 桑螟虫情监测与防控技术规程 江西省.pdf
DB2数据库安全配置基线.doc
NY-T 3926-2021 农作物品种试验规范 蔬菜.pdf
GB-T 14846-2014 铝及铝合金挤压型材尺寸偏差.pdf
专利 一种变压器散热器集流管的焊接装置.PDF
YD-T 4177.8-2023 移动互联网应用程序(APP)收集使用个人信息最小必要评估规范 第8部分:录像信息.pdf
GB-T 36403-2018 红外光学玻璃红外透过率测试方法 傅里叶变换法.pdf
GB-T 41717-2022 核电厂老化管理与寿命管理术语.pdf
T-ZZB 1236—2019 汽车减振器用轴承及其单元.pdf
GB-T 10111-2008 随机数的产生及其在产品质量抽样检验中的应用程序.pdf
ISO IEC 19770-11 2021 Information technology — IT asset management — Part 11 Requirements for bodies providing audit and certification of IT asset management systems.pdf
T-CSAE 75.2—2021 汽车防锈包装规程 第2部分:动力总成及其主要零部件.pdf
DB15-T 839—2022 高速公路养护工程预算编制办法及定额 内蒙古自治区.pdf
GB-T 31506-2015 信息安全技术 政府门户网站系统安全技术指南.pdf
T-CQMBA 1—2023 医院消毒供应中心过程质量控制管理技术及应用指南第1部分:质量可追溯记录.pdf
GB-T 31439.2-2015 波形梁钢护栏 第2部分:三波形梁钢护栏.pdf
1
/
3
19
评价文档
赞助3元 点击下载(834.7 KB)
回到顶部
×
微信扫码支付
3
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。