iso file download
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111179187.2 (22)申请日 2021.10.09 (71)申请人 咪咕文化科技有限公司 地址 100032 北京市西城区德胜门外大街 11号5幢40 0室(德胜园区) 申请人 中国移动通信集团有限公司 (72)发明人 刘宏 刘小东 邹易展 李琳  康大龙 胡艳梅  (74)专利代理 机构 深圳市世纪恒程知识产权代 理事务所 4 4287 代理人 林川靖 (51)Int.Cl. G06K 9/62(2022.01) G06N 20/00(2019.01) (54)发明名称 特征选择方法、 设备及可读存 储介质 (57)摘要 本申请公开了一种特征选择方法、 设备及可 读存储介质, 该方法包括步骤: 获取目标业务数 据在不同维度的多个数据特征; 根据所述多个数 据特征及所述多个数据特征之间的关联性, 创建 与所述目标业务数据对应的特征网络; 根据所述 多个数据特征在所述特征网络中的聚集程度, 将 所述多个数据特征进行分组, 得到多个数据特征 组; 采用所述特征网络和所述多个数据特征组对 应的差分进化算法对所述多个数据特征进行筛 选, 得到多个目标数据特征, 所述多个目标数据 特征为用于表征所述目标业务数据的特点的数 据特征集合。 本申请缩短了对数据特征进行筛选 时的筛选时间和提高了对数据特征进行筛选时 的筛选准确率。 权利要求书2页 说明书13页 附图2页 CN 114004279 A 2022.02.01 CN 114004279 A 1.一种特 征选择方法, 其特 征在于, 所述特 征选择方法包括以下步骤: 获取目标业 务数据在不同维度的多个数据特 征; 根据所述多个数据特征及所述多个数据特征之间的关联性, 创建与 所述目标业务数据 对应的特 征网络; 根据所述多个数据特征在所述特征网络中的聚集程度, 将所述多个数据特征进行分 组, 得到多个数据特 征组; 采用所述特征网络和所述多个数据特征组对应的差分进化算法对所述多个数据特征 进行筛选, 得到多个目标数据特征, 所述多个目标数据特征为用于表征所述 目标业务数据 的特点的数据特 征集合。 2.如权利要求1所述的特征选择方法, 其特征在于, 所述根据所述多个数据特征及所述 多个数据特 征之间的关联性, 创建与所述目标业 务数据对应的特 征网络, 包括: 遍历由所述多个数据特 征中每两个数据特 征组成的数据特 征对; 计算所述数据特 征对的特 征相关系数; 若所述特征相关系数的绝对值大于预设相关系数阈值, 则建立所述数据 特征对之间的 连接关系, 得到数据特 征边, 其中, 所述数据特 征边的权值 为所述特 征相关系数的绝对值; 在遍历结束后, 基于所述多个数据特征和所述数据特征边, 创建与所述目标业务数据 对应的特 征网络。 3.如权利要求1所述的特征选择方法, 其特征在于, 所述多个数据 特征组组内的数据 特 征之间的连接紧密程度大于所述多个数据特 征组组间的数据特 征之间的连接紧密程度。 4.如权利要求1所述的特征选择方法, 其特征在于, 所述采用所述特征网络和所述多个 数据特征组对应的差分进化算法对所述多个数据特征进行筛选, 得到多个目标数据特征, 包括: 生成初始种群, 其中, 所述初始种群由预设数量的初始个体组成, 其中, 所述初始个体 是一个维度为所述多个数据特征的个数的向量, 所述向量中的每一个元素对应一个数据特 征, 且其数值 为预设数值范围内的随机数; 基于预设的机器学习模型、 所述特征网络和所述多个数据特征组, 对所述初始种群进 行预设迭代次数的迭代更新, 得到目标个 体; 基于所述目标个 体确定多个目标 数据特征。 5.如权利要求4所述的特征选择方法, 其特征在于, 在每次迭代更新时, 所述方法还包 括: 对各所述初始个 体进行变异处 理, 得到变异后个 体; 基于预设归一 化方法对所述变异后个 体进行归一 化处理, 得到归一 化个体; 基于所述特 征网络和所述多个数据特 征组, 计算交叉概 率; 基于所述交叉概率对所述初始个体和所述归一化个体进行交叉处理, 得到交叉后个 体; 基于所述交叉后个体和所述初始个体确定迭代后个体, 其中, 所述迭代后个体用于确 定目标个 体。 6.如权利要求5所述的特征选择方法, 其特征在于, 所述基于所述特征网络和所述多个 数据特征组, 计算交叉概 率, 包括:权 利 要 求 书 1/2 页 2 CN 114004279 A 2随机遍历所述初始个体的元素, 并获取所述元素对应的数据特征及所在的数据特征 对, 分别得到待交叉 数据特征和目标 数据特征对; 确定所述目标 数据特征对之间的数据特 征边的权值, 得到第一权值; 获取所述目标数据特征对中除所述待交叉数据特征之外的第 一其他数据 特征, 确定所 述第一其他数据特征中所对应的元素值大于预设值的第一其他数据特征的数量, 得到第二 权值; 确定所述待交叉数据特征所在的数据特征组中除所述待交叉数据特征之外的第二其 他数据特征, 确定所述第二其他数据特征中所对应的元素值大于所述预设值的第二其他数 据特征的数量, 得到第三权值; 基于所述第一权值、 所述第二权值和所述第三权值计算交叉概 率。 7.如权利要求5所述的特征选择方法, 其特征在于, 所述基于所述交叉后个体和所述初 始个体确定迭代后个 体, 包括: 基于所述预设的机器学习模型对应的适应度函数, 分别计算所述初始个体和所述交叉 后个体对应的适应度值; 并将最大的适应度值对应的初始个体或交叉后个体作为迭代后个 体。 8.如权利要求1至7中任一项所述的特征选择方法, 其特征在于, 所述采用所述特征网 络和所述多个数据特征组对应的差 分进化算法对所述多个数据特征进 行筛选, 得到多个目 标数据特征之后, 包括: 获取所述目标业 务数据中与所述多个目标 数据特征对应的目标子业 务数据; 基于所述目标子业务数据训练预设预测器, 得到预测模型, 以通过所述预测模型对待 预测业务数据进行 预测。 9.一种特征选择设备, 其特征在于, 所述特征选择设备包括存储器、 处理器和存储在所 述存储器上并可在所述处理器上运行的特征选择程序, 所述特征选择程序被所述处理器执 行时实现如权利要求1至8中任一项所述的特 征选择方法的步骤。 10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质上存储有特征选 择程序, 所述特征选择程序被处理器执行时实现如权利要求 1至8中任一项所述的特征选择 方法的步骤。权 利 要 求 书 2/2 页 3 CN 114004279 A 3

.PDF文档 专利 特征选择方法、设备及可读存储介质

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 特征选择方法、设备及可读存储介质 第 1 页 专利 特征选择方法、设备及可读存储介质 第 2 页 专利 特征选择方法、设备及可读存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-19 02:02:48上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。