iso file download
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111232979.1 (22)申请日 2021.10.2 2 (71)申请人 北京京东振世信息技 术有限公司 地址 100086 北京市海淀区知春路76号6层 (72)发明人 杨雨田  (74)专利代理 机构 北京品源专利代理有限公司 11332 代理人 马迪 (51)Int.Cl. G06K 9/62(2022.01) G06N 20/00(2019.01) (54)发明名称 数据采集方法、 装置、 电子设备和存 储介质 (57)摘要 本发明实施例公开了一种数据采集方法、 装 置、 电子设备和存储介质, 该数据采集方法包括: 根据目标仓库的物品的历史需求量特征数据构 建样本, 得到原始样本集; 根据原始样本集中的 每个样本对应的数据产生时间将原始样本集中 的样本分类; 获取为分类得到的每类样本集设置 的样本采集策略; 按照样本采集策略从对应类别 的样本集中采集样本, 得到目标样本集。 目标样 本集用于模型训练, 可以提高模型训练效率、 提 高训练出的模型的预测准确度。 权利要求书2页 说明书10页 附图2页 CN 113988165 A 2022.01.28 CN 113988165 A 1.一种数据采集方法, 其特 征在于, 包括: 根据目标仓库的物品的历史需求 量特征数据构建样本, 得到原 始样本集; 根据所述原始样本集中的每个样本对应的数据产生时间将所述原始样本集中的样本 分类; 获取为分类得到的每 类样本集设置的样本采集策略; 按照所述样本采集策略从对应 类别的样本集中采集样本, 得到目标样本集。 2.根据权利要求1所述的数据采集方法, 其特征在于, 所述目标样本集用于训练基于特 征的时序预测算法模型, 所述时序预测算法模型用于预测所述目标仓库的物品的未来需求 量。 3.根据权利要求1所述的数据采集方法, 其特征在于, 所述根据 所述原始样本集中的每 个样本对应的数据 产生时间将所述原 始样本集中的样本分类, 包括: 将所述原始样本集中对应的数据产生时间属于预设时间集合的样本分类为第一样本 集; 将所述原 始样本集中除所述第一样本集之外的样本分类为第二样本集。 4.根据权利要求3所述的数据采集方法, 其特征在于, 所述获取为分类得到的每类样本 集设置的样本采集策略, 包括: 获取为所述第 一样本集设置的第 一样本采集策略, 所述第 一样本采集策略为基于密度 聚类算法的样本采集策略; 获取为所述第 二样本集设置的第 二样本采集策略, 所述第 二样本采集策略为基于指数 衰减算法的样本采集策略。 5.根据权利要求4所述的数据采集方法, 其特征在于, 所述按照所述样本采集策略从对 应类别的样本集中采集样本, 得到目标样本集, 包括: 按照所述第一样本采集策略从所述第一样本集采集样本, 得到第一样本 子集; 按照所述第二样本采集策略从所述第二样本集采集样本, 得到第二样本 子集; 合并所述第一样本 子集和所述第二样本 子集, 得到所述目标样本集。 6.根据权利要求5所述的数据采集方法, 其特征在于, 所述按照所述第 一样本采集策略 从所述第一样本集采集样本, 得到第一样本 子集, 包括: 获取设置的聚类半径和聚类密度最小值; 基于所述聚类半径和所述聚类密度最小值对所述第一样本集聚类, 得到样本簇, 将所 述样本簇作为所述第一样本 子集。 7.根据权利要求5所述的数据采集方法, 其特征在于, 所述按照所述第 二样本采集策略 从所述第二样本集采集样本, 得到第二样本 子集, 包括: 将所述第二样本集中的每个样本对应的数据产生 时间输入指数衰减模型, 得到所述第 二样本集中的每 个样本的采样权 重衰减系数; 根据所述第二样本集中的每个样本的采样权重衰减系数确定所述第二样本集中的每 个样本的采样权 重; 根据所述第 二样本集中的每个样本的采样权重从所述第 二样本集采集样本, 得到所述 第二样本 子集。 8.根据权利要求7 所述的数据采集方法, 其特 征在于, 所述指数衰减 模型如下:权 利 要 求 书 1/2 页 2 CN 113988165 A 2N(t)=N0e‑γt 其中, N(t)表示样本的采样权重衰减系数, N0为第一预设参数, γ为第二预设参数, t为 样本对应的数据 产生时间。 9.一种数据采集装置, 其特 征在于, 包括: 样本构建模块, 用于根据目标仓库的物品的历史需求量特征数据构建样本, 得到原始 样本集; 样本分类模块, 用于根据所述原始样本集中的每个样本对应的数据产生 时间将所述原 始样本集中的样本分类; 策略获取模块, 用于获取为分类得到的每 类样本集设置的样本采集策略; 样本采集模块, 用于按照所述样本采集策略从对应类别的样本集中采集样本, 得到目 标样本集。 10.一种电子设备, 包括存储器、 处理器及存储在所述存储器上并可在所述处理器上运 行的计算机程序, 其特征在于, 所述处理器执行所述程序时实现如权利要求1至8中任一所 述的数据采集方法。 11.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 该程序被处理器 执行时实现如权利要求1至8中任一所述的数据采集方法。权 利 要 求 书 2/2 页 3 CN 113988165 A 3

.PDF文档 专利 数据采集方法、装置、电子设备和存储介质

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 数据采集方法、装置、电子设备和存储介质 第 1 页 专利 数据采集方法、装置、电子设备和存储介质 第 2 页 专利 数据采集方法、装置、电子设备和存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-19 02:02:34上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。