iso file download
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111232979.1 (22)申请日 2021.10.2 2 (71)申请人 北京京东振世信息技 术有限公司 地址 100086 北京市海淀区知春路76号6层 (72)发明人 杨雨田 (74)专利代理 机构 北京品源专利代理有限公司 11332 代理人 马迪 (51)Int.Cl. G06K 9/62(2022.01) G06N 20/00(2019.01) (54)发明名称 数据采集方法、 装置、 电子设备和存 储介质 (57)摘要 本发明实施例公开了一种数据采集方法、 装 置、 电子设备和存储介质, 该数据采集方法包括: 根据目标仓库的物品的历史需求量特征数据构 建样本, 得到原始样本集; 根据原始样本集中的 每个样本对应的数据产生时间将原始样本集中 的样本分类; 获取为分类得到的每类样本集设置 的样本采集策略; 按照样本采集策略从对应类别 的样本集中采集样本, 得到目标样本集。 目标样 本集用于模型训练, 可以提高模型训练效率、 提 高训练出的模型的预测准确度。 权利要求书2页 说明书10页 附图2页 CN 113988165 A 2022.01.28 CN 113988165 A 1.一种数据采集方法, 其特 征在于, 包括: 根据目标仓库的物品的历史需求 量特征数据构建样本, 得到原 始样本集; 根据所述原始样本集中的每个样本对应的数据产生时间将所述原始样本集中的样本 分类; 获取为分类得到的每 类样本集设置的样本采集策略; 按照所述样本采集策略从对应 类别的样本集中采集样本, 得到目标样本集。 2.根据权利要求1所述的数据采集方法, 其特征在于, 所述目标样本集用于训练基于特 征的时序预测算法模型, 所述时序预测算法模型用于预测所述目标仓库的物品的未来需求 量。 3.根据权利要求1所述的数据采集方法, 其特征在于, 所述根据 所述原始样本集中的每 个样本对应的数据 产生时间将所述原 始样本集中的样本分类, 包括: 将所述原始样本集中对应的数据产生时间属于预设时间集合的样本分类为第一样本 集; 将所述原 始样本集中除所述第一样本集之外的样本分类为第二样本集。 4.根据权利要求3所述的数据采集方法, 其特征在于, 所述获取为分类得到的每类样本 集设置的样本采集策略, 包括: 获取为所述第 一样本集设置的第 一样本采集策略, 所述第 一样本采集策略为基于密度 聚类算法的样本采集策略; 获取为所述第 二样本集设置的第 二样本采集策略, 所述第 二样本采集策略为基于指数 衰减算法的样本采集策略。 5.根据权利要求4所述的数据采集方法, 其特征在于, 所述按照所述样本采集策略从对 应类别的样本集中采集样本, 得到目标样本集, 包括: 按照所述第一样本采集策略从所述第一样本集采集样本, 得到第一样本 子集; 按照所述第二样本采集策略从所述第二样本集采集样本, 得到第二样本 子集; 合并所述第一样本 子集和所述第二样本 子集, 得到所述目标样本集。 6.根据权利要求5所述的数据采集方法, 其特征在于, 所述按照所述第 一样本采集策略 从所述第一样本集采集样本, 得到第一样本 子集, 包括: 获取设置的聚类半径和聚类密度最小值; 基于所述聚类半径和所述聚类密度最小值对所述第一样本集聚类, 得到样本簇, 将所 述样本簇作为所述第一样本 子集。 7.根据权利要求5所述的数据采集方法, 其特征在于, 所述按照所述第 二样本采集策略 从所述第二样本集采集样本, 得到第二样本 子集, 包括: 将所述第二样本集中的每个样本对应的数据产生 时间输入指数衰减模型, 得到所述第 二样本集中的每 个样本的采样权 重衰减系数; 根据所述第二样本集中的每个样本的采样权重衰减系数确定所述第二样本集中的每 个样本的采样权 重; 根据所述第 二样本集中的每个样本的采样权重从所述第 二样本集采集样本, 得到所述 第二样本 子集。 8.根据权利要求7 所述的数据采集方法, 其特 征在于, 所述指数衰减 模型如下:权 利 要 求 书 1/2 页 2 CN 113988165 A 2N(t)=N0e‑γt 其中, N(t)表示样本的采样权重衰减系数, N0为第一预设参数, γ为第二预设参数, t为 样本对应的数据 产生时间。 9.一种数据采集装置, 其特 征在于, 包括: 样本构建模块, 用于根据目标仓库的物品的历史需求量特征数据构建样本, 得到原始 样本集; 样本分类模块, 用于根据所述原始样本集中的每个样本对应的数据产生 时间将所述原 始样本集中的样本分类; 策略获取模块, 用于获取为分类得到的每 类样本集设置的样本采集策略; 样本采集模块, 用于按照所述样本采集策略从对应类别的样本集中采集样本, 得到目 标样本集。 10.一种电子设备, 包括存储器、 处理器及存储在所述存储器上并可在所述处理器上运 行的计算机程序, 其特征在于, 所述处理器执行所述程序时实现如权利要求1至8中任一所 述的数据采集方法。 11.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 该程序被处理器 执行时实现如权利要求1至8中任一所述的数据采集方法。权 利 要 求 书 2/2 页 3 CN 113988165 A 3
专利 数据采集方法、装置、电子设备和存储介质
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助3元下载(无需注册)
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助3元下载
本文档由 人生无常 于
2024-03-19 02:02:34
上传分享
举报
下载
原文档
(625.5 KB)
分享
友情链接
GB-T 15102-2017 浸渍胶膜纸饰面纤维板和刨花板.pdf
T-CIECCPA 039—2023 垃圾焚烧电力碳足迹量化与评价方法.pdf
GB-T 42532-2023 湿地退化评估技术规范.pdf
GB-T 36572-2018电力监控系统网络安全防护导则.pdf
GB-T 11264-2012 热轧轻轨.pdf
ISO 17987-7-2016.pdf
GB-T 34690.2-2017 印刷技术 胶印数字化过程控制 第2部分:作业环境.pdf
DB31-T 1240.2-2020 公共数据共享交换工作规范 第2部分:平台接入技术要求 上海市.pdf
T-CEC 612—2022 港口岸电系统船用移动电源.pdf
DB4403-T 339-2023 城市级实景三维数据规范 深圳市.pdf
DB42-T 1854-2022 咸鸭蛋加工技术规程 湖北省.pdf
SL-T 793-2020 河湖健康评估技术导则.pdf
GB-T 42107-2022 国家科技重大专项文件归档与档案管理规范.pdf
GB-T 13299-2022 钢的游离渗碳体、珠光体和魏氏组织的评定方法.pdf
GB 50016-2012 建筑设计防火规范.pdf
GB-T 41793-2022 人造革合成革试验方法 潜在酚黄变的测定.pdf
GB-T 28448-2019 信息安全技术 网络安全等级保护测评要求.pdf
深信服 销售技巧之客户公关 2022.pdf
ISO 31101 2023 Robotics — Application services provided by service robots — Safety man.pdf
深圳经济特区科技创新条例.pdf
1
/
3
15
评价文档
赞助3元 点击下载(625.5 KB)
回到顶部
×
微信扫码支付
3
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。