专利 一种结合主动学习与迁移学习的分类模型训练方法

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202111210163.9 (22)申请日 2021.10.18 (71)申请人贵州师范大学地址 550001 贵州省贵阳市宝山北路1 16号贵州师范大学 (72)发明人曹永锋　马顺　 (74)专利代理机构贵阳中新专利商标事务所 52100 代理人李余江 (51)Int.Cl. G16H 50/20(2018.01) G16H 50/50(2018.01) G06V 10/70(2022.01) G06V 10/764(2022.01) G06V 10/774(2022.01)G06K 9/62(2022.01) G06N 20/00(2019.01) (54)发明名称一种结合主动学习与迁移学习的分类模型训练方法 (57)摘要本发明公开了一种结合主动学习与迁移学习的分类模型训练方法，主要包括如下重要步骤： 1)采用源任务模型为目标任务模型挑选训练样本的方式将源任务知识传递给目标任务模型； 2)源任务模型与目标任务模型各自主动挑选一定比例样本用于训练目标任务模型； 3)源任务模型挑选确定性高的样本，而目标任务模型挑选不确定性高的样本，并且源任务模型与目标任务模型所挑选样本数量的相对比例由两个模型分类性能的相对优劣动态决定。本发明避免了负迁移，适用于需要数据安全/隐私保护的领域，得到的目标任务训练样本集质量高，且学习更加高效。同时，减少训练目标任务模型所需的训练样本数量，缓解训练样本不平衡问题，可实现异质模型间的知识迁移。权利要求书2页说明书9页附图1页 CN 113936791 A 2022.01.14 CN 113936791 A 1.一种结合主动学习与迁移学习的分类模型训练方法，其特征在于包括： 1)采用源任务模型为目标任务模型挑选训练样本的方式将源任务知识传递给目标任务模型； 2)源任务模型与目标任务模型各自主动挑选一定比例样本用于训练目标任务模型； 3)源任务模型挑选确定性高的样本，而目标任务模型挑选不确定性高的样本，并且源任务模型与目标任务模型所挑选样本数量的相对比例由两个模型分类性能的相对优劣动态决定。 2.根据权利要求1所述的结合主动学习与迁移学习的分类模型训练方法，其特征在于包括按比例挑选样本进行标注：即对未标注样本按照联合指标MIXM(x)进行排序，无放回地挑选前α·N个样本要求标注；对未标注样本按照联合指标MIXS(x)进行排序，无放回地挑选前(1‑α )·N个样本要求标注；最后，将所有已标注样本放入已标注样本池。 3.根据权利要求1所述的结合主动学习与迁移学习的分类模型训练方法，其特征在于包括：使用类别相似性指标D#(x)， #∈{S， M}来衡量未标注样本与特定类别D的已标注样本集之间的相似性，通过在联合指标MIX#(x)， #∈{S， M}中增大类别相似性指标所占权重，可使模型S和M更多挑选属于特定类别D的样本，从而缓解特定类别D与其他类别之间的样本不平衡，或者达成在样本数量上的某种平衡。 4.根据权利要求1 ‑3中任意一项所述的结合主动学习与迁移学习的分类模型训练方法，其特征在于该方法由如下步骤完成：步骤1，模型与样本准备：将目标任务未标注样本放入未标注样本池U，将目标任务已标注样本放入已标注样本池L；加载最新的源任务模型M和目标任务模型S；设定本次迭代t要标注的样本数目N；步骤2，未标注样本分类预测；步骤3，类别相似性指标计算；步骤4，不确定性和确定性指标计算；步骤5，联合指标计算；步骤6，按比例挑选样本进行标注；步骤7，训练目标任务模型：使用已标注样本池中的数据训练目标任务模型；步骤8，迭代：重复步骤2至步骤7，直至标注预算用完或目标任务模型已经达到特定性能。 5.根据权利要求4所述的结合主动学习与迁移学习的分类模型训练方法，其特征在于：步骤2包括如下两种独立执行或共同执行的方案：： 1)将未标注样本池中的每一个样本x通过目标任务模型S，获得其分类预测的边缘概率分布向量 FS(x)＝[pS(c＝1|x)， . ..， pS(c＝i|x)， ...， pS(c＝C|x)] 其中， C为类别总数， pS(c＝i|x)为模型S下样本x属于类别i的概率； 2)将未标注样本池中的每一个样本x通过源任务模型M，获得其分类预测的边缘概率分布向量 FM(x)＝[pM(c＝1|x)， . ..， pM(c＝i|x)， ...， pM(c＝C|x)] 其中， C为类别总数， pM(c＝i|x)为模型M下样本x属于类别i的概率。权　利　要　求　书 1/2 页 2 CN 113936791 A 26.根据权利要求4所述的结合主动学习与迁移学习的分类模型训练方法，其特征在于：步骤3包括如下两种独立执行或共同执行的方案：： 1)计算每一个未标注样本x在目标模型S下的类别相似性指标，如下式其中， DX为属于类别D的已标注样本构成的集合， |DX|为集合DX所包含样本的数目， D为类别集合{1， ...， i， ...， C}的一个子集； 2)计算每一个未标注样本x在源模型M下的类别相似性指标，如下式其中， DX为属于类别D的已标注样本集合， |DX|为集合DX所包含样本的数目， D为类别集合{1， ...， i， ...， C}的一个子集；当|DX|＝0时，取DS(x)＝DM(x)＝0。 7.根据权利要求4所述的结合主动学习与迁移学习的分类模型训练方法，其特征在于：步骤4包括如下两种独立执行或共同执行的方案：： 1)计算每个未标注样本x在目标任务模型S下的不确定性，如下式 2)计算每个未标注样本x在源任务模型M下的确定性，如下式 8.根据权利要求4所述的结合主动学习与迁移学习的分类模型训练方法，其特征在于：步骤5包括如下两种独立执行或共同执行的方案：： 1)对每个未标注样本x，结合步骤3，步骤4的结果计算其相对于目标任务模型S的联合指标，如下式 MIXS(x)＝γ·UncertaintyS(x)+(1‑γ)·DS(x) 其中， γ∈[0， 1]为一经验参数； 2)对每个未标注样本x，结合步骤3，步骤4的结果计算其相对于源任务模型M的联合指标，如下式 MIXM(x)＝γ·CncertaintyM(x)+(1‑γ)·DM(x) 其中， γ∈[0， 1]为一经验参数。权　利　要　求　书 2/2 页 3 CN 113936791 A 3

专利 一种结合主动学习与迁移学习的分类模型训练方法

专利一种结合主动学习与迁移学习的分类模型训练方法