iso file download
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111173239.5 (22)申请日 2021.10.08 (71)申请人 腾讯科技 (深圳) 有限公司 地址 518057 广东省深圳市南 山区高新区 科技中一路腾讯大厦3 5层 (72)发明人 邓克琦 曹松军 马龙  (74)专利代理 机构 深圳市深佳知识产权代理事 务所(普通 合伙) 44285 代理人 罗晓敏 (51)Int.Cl. G06F 16/33(2019.01) G06F 16/35(2019.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06N 20/00(2019.01) (54)发明名称 一种数据处理方法、 装置、 设备、 存储介质和 程序产品 (57)摘要 本申请实施例公开了一种数据处理方法、 装 置、 设备、 存储介质和程序产品, 由于第一语音训 练样本中的多段子语音信息对应于同一口音类 型用户, 因此多段子语音信息具有相似的口音特 征。 基于此, 基于人工智能技术, 根据多段子语音 信息口音特征之间的差异确定第一损失函数, 根 据待定口音类型与样本口音类型之间差异确定 第二损失函数, 基于第一损失函数和第二损失函 数对初始口音分类模型进行参数调整, 可以一方 面使初始口音分类模型所确定出的口音类型更 加准确, 一方面可 以使模型在训练的过程中, 控 制所确定出的子语音信息口音特征之间的差异 在合理范围内, 使口音特征确定的方式更加贴合 真实的口音情况, 提高口音分类模 型训练的准确 度和合理性。 权利要求书3页 说明书19页 附图9页 CN 114328811 A 2022.04.12 CN 114328811 A 1.一种数据处 理方法, 其特 征在于, 所述方法包括: 获取对应样本口音类型的第 一语音训练样本, 所述第 一语音训练样本包括对应同一口 音类型用户的多段子语音信息; 根据所述第一语音训练样本和初始口音分类模型确定所述多段子语音信息分别对应 的口音特征, 以及所述第一语音训练样本对应的待定口音类型, 所述待定口音类型是基于 所述口音特 征确定的; 确定所述第 一语音训练样本对应的第 一损失函数和第 二损失函数, 所述第 一损失函数 是根据所述多段子语音信息 分别对应的口音 特征之间的差异确定的, 所述第二损失函数是 根据所述待定口音类型与所述样本口音类型之间的差异确定的; 根据所述第一损 失函数、 所述第二损 失函数对所述初始 口音分类模型进行参数调整, 得到口音分类模型, 所述口音分类模型用于确定待分类 语音信息对应的 口音类型。 2.根据权利要求1所述的方法, 其特征在于, 所述初始口音分类模型包括初始特征提取 子模型和初始特征分类子模型, 所述初始特征提取子模型用于确定所述多段子语音信息分 别对应的所述口音特征, 所述初始特征分类子模型用于根据所述口音 特征确定所述待定口 音类型, 所述根据所述第一损失函数、 所述第二损失函数对所述初始口音分类模型进行参 数调整, 得到口音分类模型, 包括: 根据所述第 一损失函数和所述第 二损失函数, 对所述初始特征提取子模型进行参数调 整, 得到特 征提取子模型; 根据所述第二损 失函数, 对所述初始特征分类子模型进行参数调整, 得到特征分类子 模型; 根据所述特 征提取子模型和所述特 征分类子模型, 确定所述口音分类模型。 3.根据权利要求2所述的方法, 其特 征在于, 所述方法还 包括: 确定所述第一损失函数对应的第一权重参数和所述第二损失函数对应的第二权重参 数; 所述根据 所述第一损失函数和所述第 二损失函数, 对所述初始特征提取子模型进行参 数调整, 得到特 征分类子模型, 包括: 根据所述第一损失函数、 所述第 一权重参数、 所述第 二损失函数、 所述第 二权重参数确 定综合损失函数; 根据所述综合损失函数对所述初始特征提取子模型进行参数调整, 得到特征提取子模 型。 4.根据权利要求2所述的方法, 其特征在于, 在所述根据 所述第一语音训练样本和初始 口音分类模型确定所述多段子语音信息分别对应的 口音特征之前, 所述方法还 包括: 获取自监 督学习模型和第二语音训练样本; 通过所述自监督学习模型, 确定所述第二语音训练样本对应的目标语音信息, 所述目 标语音信息对应于所述第二语音训练样本中的目标语音部分; 通过所述自监督学习模型, 根据去 除所述目标语音信息后的所述第二语音训练样本, 确定所述目标语音部分对应的待定语音信息; 根据所述目标语音信 息和所述待定语音信 息之间的差异, 确定所述第 二语音训练样本 对应的第三损失函数;权 利 要 求 书 1/3 页 2 CN 114328811 A 2根据所述第 三损失函数对所述自监督学习 模型进行参数调整, 并根据调整后的所述自 监督学习模型确定所述初始特 征提取子模型。 5.根据权利要求2所述的方法, 其特征在于, 所述根据所述第 一损失函数和所述第 二损 失函数, 对所述初始特 征提取子模型进行参数调整, 得到特 征提取子模型, 包括: 响应于针对所述初始特征分类子模型的参数调 整次数达到预设次数, 根据所述第 一损 失函数和所述第二损失函数, 对所述初始特征提取子模型进行参数调整, 得到所述特征提 取子模型。 6.根据权利要求4所述的方法, 其特征在于, 所述第 一语音训练样本与 所述第二语音训 练样本相同。 7.根据权利要求1 ‑6中任意一项所述的方法, 其特征在于, 所述第一语音训练样本为语 音训练样本集所包括的多个第一语音训练样本中的任意一个, 所述多个第一语音训练样本 所包括的多段子语音信息对应第一用户和 第二用户, 所述第一用户的口音类型与所述第二 用户的口音类型不同。 8.根据权利要求7所述的方法, 其特征在于, 所述多个第 一语音训练样本对应于同一语 种, 不同口音类型的用户对应于不同的 口音区域。 9.一种数据处理装置, 其特征在于, 所述装置包括第一获取单元、 第一确定单元、 第二 确定单元和第一调整单 元: 所述第一获取单元, 用于获取对应样本口音类型的第一语音训练样本, 所述第一语音 训练样本包括对应同一口音类型用户的多段子语音信息; 所述第一确定单元, 用于根据 所述第一语音训练样本和初始口音分类模型确定所述多 段子语音信息分别对应的口音特征, 以及所述第一语音训练样本对应的待定口音类型, 所 述待定口音类型 是基于所述口音特 征确定的; 所述第二确定单元, 用于确定所述第 一语音训练样本对应的第 一损失函数和第 二损失 函数, 所述第一损失函数是根据所述多段子语音信息分别对应的口音 特征之间的差异确定 的, 所述第二损失函数 是根据所述待定口音类型与所述样本口音类型之间的差异确定的; 所述第一调整单元, 用于根据所述第一损 失函数、 所述第二损 失函数对所述初始 口音 分类模型进行参数调整, 得到口音分类模型, 所述口音分类模型用于确定待分类语音信息 对应的口音类型。 10.根据权利要求9所述的装置, 其特征在于, 所述初始口音分类模型包括初始特征提 取子模型和初始特征分类子模型, 所述初始特征提取子模型用于确定所述多段子语音信息 分别对应的所述口音 特征, 所述初始特征分类子模型用于根据所述口音 特征确定所述待定 口音类型, 所述第一调整单 元具体用于: 根据所述第 一损失函数和所述第 二损失函数, 对所述初始特征提取子模型进行参数调 整, 得到特 征提取子模型; 根据所述第二损 失函数, 对所述初始特征分类子模型进行参数调整, 得到特征分类子 模型; 根据所述特 征提取子模型和所述特 征分类子模型, 确定所述口音分类模型。 11.根据权利要求10所述的装置, 其特 征在于, 所述装置还 包括第三确定单 元: 所述第三确定单元, 用于确定所述第 一损失函数对应的第 一权重参数和所述第 二损失权 利 要 求 书 2/3 页 3 CN 114328811 A 3

.PDF文档 专利 一种数据处理方法、装置、设备、存储介质和程序产品

文档预览
中文文档 32 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共32页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种数据处理方法、装置、设备、存储介质和程序产品 第 1 页 专利 一种数据处理方法、装置、设备、存储介质和程序产品 第 2 页 专利 一种数据处理方法、装置、设备、存储介质和程序产品 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-19 02:00:09上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。