iso file download
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111210163.9 (22)申请日 2021.10.18 (71)申请人 贵州师范大学 地址 550001 贵州省贵阳市宝山北路1 16号 贵州师范大学 (72)发明人 曹永锋 马顺 (74)专利代理 机构 贵阳中新专利商标事务所 52100 代理人 李余江 (51)Int.Cl. G16H 50/20(2018.01) G16H 50/50(2018.01) G06V 10/70(2022.01) G06V 10/764(2022.01) G06V 10/774(2022.01)G06K 9/62(2022.01) G06N 20/00(2019.01) (54)发明名称 一种结合主动学习与迁移学习的分类模型 训练方法 (57)摘要 本发明公开了一种结合主动学习与迁移学 习的分类模型训练方法, 主要包括如下重要步 骤: 1)采用源任务模型为目标任务模型挑选训练 样本的方式将 源任务知 识传递给目标任务模型; 2)源任务模型与目标任务模型各自主动挑选一 定比例样本用于训练目标任务模型; 3)源任务模 型挑选确定性高的样本, 而目标任务模型挑选不 确定性高的样本, 并且源任务模 型与目标任务模 型所挑选样本数量的相对比例由两个模型分类 性能的相对优劣动态决定。 本发明避免了负迁 移, 适用于需要数据安全/隐私保护的领域, 得到 的目标任务训练样本集质量高, 且学习更加高 效。 同时, 减少训练目标任务模型所需的训练样 本数量, 缓解训练样本不平衡问题, 可实现异质 模型间的知识迁移。 权利要求书2页 说明书9页 附图1页 CN 113936791 A 2022.01.14 CN 113936791 A 1.一种结合主动学习与迁移学习的分类模型训练方法, 其特 征在于包括: 1)采用源任务模型为目标任务模型挑选训练样本的方式将源任务知识传递给目标任 务模型; 2)源任务模型与目标任务模型 各自主动挑选一定比例样本用于训练目标任务模型; 3)源任务模型挑选确定性高的样本, 而目标任务模型挑选不确定性高的样本, 并且源 任务模型与目标任务模型所挑选样本数量的相对比例由两个模型分类性能的相对优劣动 态决定。 2.根据权利要求1所述的结合主动学习与迁移学习的分类模型训练方法, 其特征在于 包括按比例挑选样本进行标注: 即对未标注样本按照联合指标MIXM(x)进行排序, 无放回地 挑选前α·N个样本要求标注; 对未标注样本按照联合指 标MIXS(x)进行排序, 无放回地挑选 前(1‑α )·N个样本要求标注; 最后, 将所有已标注样本放入已标注样本池。 3.根据权利要求1所述的结合主动学习与迁移学习的分类模型训练方法, 其特征在于 包括: 使用类别相似性指标D#(x), #∈{S, M}来衡量未标注样本与特定类别D的已标注样本 集之间的相似性, 通过在联合指标MIX#(x), #∈{S, M}中增大类别相似性指标所占权重, 可 使模型S和M更多挑选属于特定类别D的样本, 从而缓解特定类别D与其他类别之 间的样本不 平衡, 或者达成在样本数量上的某种平衡。 4.根据权利要求1 ‑3中任意一项所述的结合主动学习与迁移学习的分类模型训练方 法, 其特征在于该 方法由如下步骤完成: 步骤1, 模型与样本准备: 将目标任务未标注样本放入未标注样本池U, 将目标任务已标 注样本放入已标注样本池L; 加载最新的源任务模型M和目标任务模型S; 设定本次迭代t要 标注的样本数目N; 步骤2, 未 标注样本分类预测; 步骤3, 类别相似性指标计算; 步骤4, 不确定性和 确定性指标计算; 步骤5, 联合指标计算; 步骤6, 按比例挑选样本进行 标注; 步骤7, 训练目标任务模型: 使用已标注样本池中的数据训练目标任务模型; 步骤8, 迭代: 重复步骤2至步骤7, 直至标注预算用完或目标任务模型已经达到特定性 能。 5.根据权利要求4所述的结合主动学习与迁移学习的分类模型训练方法, 其特征在于: 步骤2包括如下两种独立执 行或共同执 行的方案: : 1)将未标注样本池中的每一个样本x通过目标任务模型S, 获得其分类预测的边缘概率 分布向量 FS(x)=[pS(c=1|x), . .., pS(c=i|x), ..., pS(c=C|x)] 其中, C为类别总数, pS(c=i|x)为模型S下样本x属于类别i的概 率; 2)将未标注样本池中的每一个样本x通过源任务模型M, 获得其分类预测的边缘概率分 布向量 FM(x)=[pM(c=1|x), . .., pM(c=i|x), ..., pM(c=C|x)] 其中, C为类别总数, pM(c=i|x)为模型M下样本x属于类别i的概 率。权 利 要 求 书 1/2 页 2 CN 113936791 A 26.根据权利要求4所述的结合主动学习与迁移学习的分类模型训练方法, 其特征在于: 步骤3包括如下两种独立执 行或共同执 行的方案: : 1)计算每一个未 标注样本x在目标模型S下的类别相似性指标, 如下式 其中, DX为属于类别D的已标注样本构成的 集合, |DX|为 集合DX所包含样本的数目, D为类别集 合{1, ..., i, ..., C}的一个子集; 2)计算每一个未 标注样本x在源 模型M下的类别相似性指标, 如下式 其中, DX为属于类别D的已标注样本集合, |DX|为集合DX所包含样本的数目, D为类别集 合{1, ..., i, ..., C}的一个子集; 当|DX|=0时, 取DS(x)=DM(x)=0。 7.根据权利要求4所述的结合主动学习与迁移学习的分类模型训练方法, 其特征在于: 步骤4包括如下两种独立执 行或共同执 行的方案: : 1)计算每 个未标注样本x在目标任务模型S下的不确定性, 如下式 2)计算每 个未标注样本x在源 任务模型M下的确定性, 如下式 8.根据权利要求4所述的结合主动学习与迁移学习的分类模型训练方法, 其特征在于: 步骤5包括如下两种独立执 行或共同执 行的方案: : 1)对每个未标注样本x, 结合步骤3, 步骤4的结果计算其相对于目标任务模型S的联合 指标, 如下式 MIXS(x)=γ·UncertaintyS(x)+(1‑γ)·DS(x) 其中, γ∈[0, 1]为 一经验参数; 2)对每个未标注样本x, 结合步骤3, 步骤4的结果计算其相对于源任务模型M的联合指 标, 如下式 MIXM(x)=γ·CncertaintyM(x)+(1‑γ)·DM(x) 其中, γ∈[0, 1]为 一经验参数。权 利 要 求 书 2/2 页 3 CN 113936791 A 3
专利 一种结合主动学习与迁移学习的分类模型训练方法
文档预览
中文文档
13 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助3元下载(无需注册)
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助3元下载
本文档由 人生无常 于
2024-03-19 02:00:45
上传分享
举报
下载
原文档
(635.2 KB)
分享
友情链接
GB T 42447-2023 信息安全技术 电信领域数据安全指南.pdf
民航 MH-T 0046-2014 民航重要信息系统灾难备份与恢复实施规范.pdf
DB52-T 1653-2022 软件开发费用测算规范 贵州省.pdf
MZ-T 156-2020 低视力康复服务规范.pdf
GB 37822-2019 挥发性有机物无组织排放控制标准.pdf
GB-T 43795-2024 磁性氧化物制成的磁心机械强度测试方法.pdf
GB-T 8733-2016 铸造铝合金锭.pdf
GB-T 21063.2-2007 政务信息资源目录体系 第2部分 技术要求.pdf
T-STIC 120051—2021 民用船舶设计服务规范.pdf
SN-T 5405.1-2021 互联网环境下的认证技术指南 第1部分:总则.pdf
GB-T 42884-2023 信息安全技术 移动互联网应用程序 App 生命周期安全管理指南.pdf
GB-T 27930-2023 非车载传导式充电机与电动汽车之间的数字通信协议.pdf
GB-T 32905-2016 信息安全技术 SM3密码杂凑算法.pdf
T-CI 126—2023 高寒草地碳储量及碳汇核算技术导则.pdf
GB-T 43582-2023 区块链和分布式记账技术 应用程序接口 中间件技术指南.pdf
T-ASCQ 001—2022 波束形成定向扩声系统技术规范.pdf
GB-T 39440-2020 公共信用信息资源目录编制指南.pdf
T-CQMBA 1—2023 医院消毒供应中心过程质量控制管理技术及应用指南第1部分:质量可追溯记录.pdf
GA-T 1547-2019 信息安全技术 移动智能终端用户数据存储安全技术要求和测试评价方法.pdf
GB-T 33173-2016 资产管理 管理体系 要求.pdf
1
/
3
13
评价文档
赞助3元 点击下载(635.2 KB)
回到顶部
×
微信扫码支付
3
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。