iso file download
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111237748.X (22)申请日 2021.10.2 2 (71)申请人 北京工业大 学 地址 100124 北京市朝阳区平乐园10 0号 (72)发明人 王立春 李爽 王少帆 孔德慧 尹宝才 (74)专利代理 机构 北京市中 闻律师事务所 11388 代理人 冯梦洪 (51)Int.Cl. G06V 10/772(2022.01) G06V 10/774(2022.01) G06K 9/62(2022.01) G06N 20/00(2019.01) (54)发明名称 一种面向零样本识别的字典学习方法及装 置 (57)摘要 公开一种面向零样本识别的字典学习方法 及装置, 可以从类别层面和图像层面分别建立视 觉空间和语义空间之间的对齐, 从而实现高精度 的零样本图像识别。 方法包括: (1)基于跨域字典 学习方法训练类别层的跨域字典; (2)基于步骤 (1)学习的类别层跨域字典生成图像的语义属 性; (3)基于步骤(2)生成的 图像语义属性训练图 像层的跨域字典; (4)基于步骤(3)学习的图像层 跨域字典完成对不可 见类别图像的识别任务。 权利要求书4页 说明书8页 附图2页 CN 114037879 A 2022.02.11 CN 114037879 A 1.一种面向零样本识别的字典学习方法, 其特 征在于: 该 方法包括以下步骤: (1)基于跨 域字典学习方法训练类别层的跨 域字典; (2)基于步骤(1)学习的类别层跨 域字典生成图像的语义属性; (3)基于步骤(2)生成的图像 语义属性训练图像层的跨 域字典; (4)基于步骤(3)学习的图像层跨 域字典完成对不可 见类别图像的识别任务。 2.根据权利要求1所述的面向零样本识别的字典学习方法, 其特征在于: 所述步骤(1) 包括: (1.1)通过计算可 见类别图像的类别中心提取视 觉空间的类别原型Pv, 为公式(1): 其中, Yv是样本特 征矩阵; H为样本标签矩阵; (1.2)将类别原型Pv与类别语义属性Ps组成一对输入, 训练类别层的跨域字典, 通过约 束类别原型与类别语义属 性共享稀疏系数在类别层面建立视觉空间和语义空间之间的联 系, 具体表达式为公式(2): 其中, 第一项为视觉空间字典重构误差项; 第二项为语义空间字典的重构误差项; Dv为 视觉空间字典; Ds为语义空间字典; Xp为稀疏系数矩阵; λ为调和参数; (1.3)为了降低可见类别和不可见类别之间的域差异对模型精度造成的影响, 提升模 型对不可 见类别样本的识别能力, 引入不可 见类别的自适应损失函数, 为公式(3): 其中, 为待求解的不可见类的类别原型; 为不可见类别的语义属性矩阵; 为不 可见类别对应的稀疏系数矩阵; 类别层的联合损失函数为公式(4): 类别层的训练目标是最小化式(4)所示的损失函数, 待求解出变量包括: 视觉空间字典 Dv; 语义空间字典Ds; 可见类别原型Pv; 不可见类别原型 可见类稀疏系数Xp; 不可见类稀 疏系数 3.根据权利要求2所述的面向零样本识别的字典学习方法, 其特征在于: 所述步骤(2) 包括: (2.1)利用视 觉空间字典Dv生成图像的稀疏系数 Xy, 具体表达式为公式(5): 其中, 第一项为重构误差项; 第 二项为约束项, 约束生成的图像稀疏系数与其所属类别 基于同一个视 觉空间字典Dv生成的稀疏系数相近; wx为调和参数; (2.2)利用语义空间字典Ds和其所属类别语义属性Ps联合生成图像语义属性Ys, 具体表 达式为公式(6): 权 利 要 求 书 1/4 页 2 CN 114037879 A 2其中, wp为调和参数。 4.根据权利要求3所述的面向零样本识别的字典学习方法, 其特征在于: 所述步骤(3) 包括: 为了更加深入地挖掘图像的信息, 提升模型的泛化性能, 利用步骤(2)生成的图像语义 属性训练图像层的跨 域字典, 具体表达式为公式(7): 其中, 第一项为视觉空间的重构误差项; 第二项为语义空间的重构误差项; 和 分别为视 觉空间和语义空间在图像层的字典; X为稀疏系数; μ为调和参数。 5.根据权利要求4所述的面向零样本识别的字典学习方法, 其特征在于: 所述步骤(4) 包括: 在视觉空间比较方面: 不可见类别语义属性 首先通过图像层语义空间字典 生成稀疏系数Xu, 为公式 (8): 再利用视觉空间字典 生成类别在视觉空间的表达 分别度量测 试图像与每 个类别描述 的距离并根据距离判断测试图像的类别, 为公式(9): 在稀疏域比较方面: 测试图像根据图像层的视觉空间字典提取其在稀疏空间的表达, 为公式(10): 度量xu与各类别在稀疏空间的描述Xu[c]之间的距离, 距离测试图像最近的类别为该图 像的类别, 为公式(1 1): 在语义空间比较方面: 首先根据图像层的视觉空间字典对测试图像进行编码, 得到xu; 然后根据图像层的语义 空间字典生成图像的语义属性 度量ys与各类别语义属性的距离并根据距离 判断测试图像的类别, 为公式(12): 6.根据权利要求5所述的面向零样本识别的字典学习方法, 其特征在于: 该方法在两个 基于零样 本识别任务的图像数据集: A wA数据集、 aPY数据集上进 行实验, 并且将识别精度与 目前主流零样本识别模型进行对比, 包括SJE、 EZSL、 SYNC、 SAE、 CDL、 ALE、 CONSE、 LATEM、 DEVISE; AwA是一个动物图像数据集, 其中包含50种动物类别以及30475张图像, 每个类有85 个带注释的属性; 零样本识别实验的标准划分是将40个类别用作可见类别, 将其他10个类 别用作不可 见类别。 7.一种面向零样本识别的字典学习装置, 其特 征在于: 该装置包括:权 利 要 求 书 2/4 页 3 CN 114037879 A 3
专利 一种面向零样本识别的字典学习方法及装置
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助3元下载(无需注册)
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助3元下载
本文档由 人生无常 于
2024-03-19 02:01:12
上传分享
举报
下载
原文档
(893.4 KB)
分享
友情链接
NB-T 10897—2021 烃基生物柴油.pdf
GB-T 42731-2023 微电网技术要求.pdf
GB/T 36621-2018 智慧城市 信息技术运营指南.pdf
GB-T 35680-2017 液体材料微波频段使用开口同轴探头的电磁参数测量方法.pdf
GB-T 22342-2022 石油天然气钻采设备 井下安全阀系统设计、安装、操作、试验和维护.pdf
GB-T 19515-2023 道路车辆 可再利用率和可回收利用率 要求及计算方法.pdf
GB-T 706-2016 热轧型钢.pdf
GB-T 10647-2008 饲料工业术语.pdf
GB-T 2102-2022 钢管的验收、包装、标志和质量证明书.pdf
GB-T 34969-2017 彩色激光打印机测试版.pdf
GB-T 14264-2009 半导体材料术语.pdf
GB-T 32678-2016 橡胶配合剂 高分散沉淀水合二氧化硅.pdf
商用密码应用安全性评估报告模板-中国密码学会密评联委会-202112.pdf
GB-T 33480-2016 党政机关电子公文元数据规范.pdf
GM-T 0115-2021 信息系统密码应用测评要求.pdf
GB-T 40753.3-2024 供应链安全管理体系 ISO 28000实施指南 第3部分:中小企业采用ISO 28000的附加特定指南 海港除外.pdf
T-FSCPLC 02—2021 汽车维修行业清洁生产评价指标体系.pdf
绿盟 关键信息基础设施安全态势感知平台产品白皮书.pdf
GB-T 24353-2022 风险管理指南 .pdf
GB-T 31129-2014 制造业信息化标准体系结构.pdf
1
/
3
15
评价文档
赞助3元 点击下载(893.4 KB)
回到顶部
×
微信扫码支付
3
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。