iso file download
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111159578.8 (22)申请日 2021.09.3 0 (71)申请人 合肥小刺猬 信息科技有限公司 地址 230000 安徽省合肥市包河区加侨国 际广场C座240 6室 (72)发明人 陈浩 (74)专利代理 机构 合肥市科融知识产权代理事 务所(普通 合伙) 34126 代理人 李慧 (51)Int.Cl. G06F 16/9535(2019.01) G06F 16/906(2019.01) G06N 20/00(2019.01) (54)发明名称 一种基于机器学习的数据分类方法和系统 (57)摘要 本发明涉及信息处理相关技术领域, 公开了 一种基于机器学习的数据分类方法和系统, 包括 用户行为获取模块、 访问兴趣划分模块、 兴趣内 容标签模块以及云端内容获取模块; 通过用户行 为获取模块对用户网络内容浏览的数据内容及 行为进行记录, 并通过访问兴趣划分模块对用户 浏览数据内容的行为进行分析, 生成用户对浏览 内容的兴趣等级, 并根据用户的兴趣等级对数据 内容进行划分, 以用户为分类单元在并以数据内 容的特征作为分类单元的特征进行分类并在云 端同步, 进而实现了通过用户分类进行云端检索 的数据内容推送模式, 能够通过具有相似兴趣的 用户云端分类获取内容推送, 使得个性化推送更 为精准可靠 。 权利要求书2页 说明书6页 附图2页 CN 113901311 A 2022.01.07 CN 113901311 A 1.一种基于 机器学习的数据分类系统, 其特 征在于, 包 含以下步骤: 用户行为获取模块, 用于获取用户的行为记录数据, 所述行为记录数据包括访 问内容 数据以及访问行为数据, 所述用户浏览行为记录用于表征用户在一段时间内的网络内容浏 览行为; 访问兴趣划分模块, 用于对所述行为记录数据进行访问行为分析, 生成用户兴趣等级, 所述用户兴趣等级用于表征 所述用户对于网络内容的兴趣程度; 兴趣内容标签模块, 用于根据所述用户兴趣等级读取所述访 问内容数据, 对所述访 问 内容数据进行特征处理, 生成特征标签并在预设的喜好类别库中存储, 所述特征标签用于 表征用户所感兴趣的网络内容的内容关键词, 所述喜好类别库为云端同步库, 所述喜好类 别库为匿名库; 云端内容获取模块, 用于根据所述特征标签对云端的数个所述喜好类别库进行检索, 获取具有相同所述特征标签的所述喜好类别库中的多个访问内容数据并生成喜好推送列 表, 所述喜好推送列表为 根据用户喜好向用户推送的访问内容数据列表。 2.根据权利要求1所述的基于机器学习的数据分类系统, 其特征在于, 所述访问兴趣划 分模块包括: 行为获取单元, 用于获取所述行为记录数据的访 问行为数据, 所述访 问行为数据包括 访问持续时间以及访问完成比例, 所述访问完成比例用于表征用户对所述访问内容数据的 浏览完成占比; 兴趣评级单元, 用于根据所述访问完成比例以及所述访问持续 时间对所述行访问内容 数据进行访问行为分析, 生成用户兴趣等级, 所述访问行为分析用于根据访问完成比例以 及访问持续时间计算评估用户兴趣等级。 3.根据权利要求1所述的基于机器学习的数据分类系统, 其特征在于, 所述兴趣内容标 签模块包括: 用户自定标签单元, 用于接收并生成用户自定标签, 所述用户自定标签用于表征用户 对所述访问内容数据中某一部分特定 部分的兴趣等级。 4.根据权利要求3所述的基于机器学习的数据分类系统, 其特征在于, 所述用户自定标 签单元具体包括: 云自定标签接收子单 元, 用于接收所述访问内容数据的所述用户自定标签并输出; 用户反馈接收子单元, 用于接收来自用户的用户自定标签生成信号, 并生成所述用户 自定标签; 自定标签云同步子单元, 用于将所述用户自定标签上传至云端服务器与对应的所述访 问内容数据同步。 5.根据权利要求4所述的基于机器学习的数据分类系统, 其特征在于, 在所述云端内容 获取模块执行所述根据所述特征标签对云端的数个所述喜好类别库进 行检索的步骤时, 所 述用户自定标签的优先级大于所述特 征标签。 6.根据权利要求1所述的基于机器学习的数据分类系统, 其特征在于, 所述用户行为获 取模块包括: 白名单保护单元, 用于通过预设的获取白名单对所述获取用户的行为记录数据的执行 范围进行限定 。权 利 要 求 书 1/2 页 2 CN 113901311 A 27.一种基于 机器学习的数据分类方法, 其特 征在于, 包 含步骤: 获取用户的行为记录数据, 所述行为记录数据包括访 问内容数据以及访 问行为数据, 所述用户浏览行为记录用于表征用户在一段时间内的网路数据浏览行为; 对所述行为记录数据进行访 问行为分析, 生成用户兴趣等级, 所述用户兴趣等级用于 表征所述用户对于网络内容的兴趣程度; 根据所述用户兴趣等级读取所述访 问内容数据, 对所述访 问内容数据进行特征处理, 生成特征标签并在预设的喜好类别库中存储, 所述特征标签用于表征用户所感兴趣的网络 内容的内容关键词, 所述喜好类别库为云端同步库, 所述喜好类别库为匿名库; 根据所述特征标签对云端的数个所述喜好类别库进行检索, 获取具有相同所述特征标 签的所述喜好类别库中的多个访问内容数据并生成喜好推送列 表, 所述喜好推送列 表为根 据用户喜好向用户推送的访问内容数据列表。 8.根据权利要求7所述的基于机器学习的数据分类方法, 其特征在于, 所述对所述行为 记录数据进行访问行为分析, 生成用户兴趣等级的步骤具体包括: 获取所述行为记录数据的访问行为数据, 所述访问行为数据包括访问持续 时间以及访 问完成比例, 所述访问完成比例用于表征用户对所述访问内容数据的浏览完成占比; 根据所述访问完成比例以及所述访问持续时间对所述行访问内容数据进行访问行为 分析, 生成用户兴趣等级, 所述访问行为分析用于根据访问完成比例以及访问持续时间计 算评估用户兴趣等级。 9.根据权利要求8所述的基于 机器学习的数据分类方法, 其特 征在于, 还 包括步骤: 接收并生成用户自定标签, 并在所述喜好类别库中存储, 所述用户自定标签用于表征 用户对所述访问内容数据中某一部分特定 部分的兴趣等级。权 利 要 求 书 2/2 页 3 CN 113901311 A 3
专利 一种基于机器学习的数据分类方法和系统
文档预览
中文文档
11 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助3元下载(无需注册)
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助3元下载
本文档由 人生无常 于
2024-03-19 01:59:33
上传分享
举报
下载
原文档
(451.3 KB)
分享
友情链接
T-WX 0001—2017 移动终端数字证书应用标准 总体框架.pdf
信通院 人工智能生成内容 AIGC 白皮书 2022年.pdf
DB15-T 1109-2017 信用信息系统运行维护管理规范 内蒙古自治区.pdf
GB-T 23703.7-2014 知识管理 第7部分:知识分类通用要求.pdf
T-SCGS 313002—2023 医用内窥镜 内窥镜荧光摄像系统影像质量评价规范.pdf
GB-T 20945-2023 信息安全技术 网络安全审计产品技术规范.pdf
GB-T 32541-2016 热处理质量控制体系.pdf
GB-T 36957-2018 信息安全技术 灾难恢复服务要求.pdf
GB-T 42430-2023 血液、尿液中乙醇、甲醇、正丙醇、丙酮、异丙醇和正丁醇检验.pdf
CY-T 121-2015 学术出版规范 注释.pdf
GB-T 40750-2021 农用沼液.pdf
DB31-T 1311-2021 上海市 数据去标识化共享指南 .pdf
GB-T 43572-2023 区块链和分布式记账技术 术语.pdf
T-CSAE 111—2019 乘用车空气动力学性能术语.pdf
GB/T 40685-2021 信息技术服务 数据资产 管理要求.pdf
T-CASME 668—2023 CD3-CD4-CD8-CD16+CD56-CD19-CD45检测试剂盒 流式细胞仪法-6色.pdf
GB-T 32921-2016 信息安全技术 信息技术产品供应方行为安全准则.pdf
GB-T 40013-2021 服务机器人 电气安全要求及测试方法.pdf
T-CSTM 00790.4—2022 汽车用薄钢板 第4部分:双向拉伸试验十字形拉伸试样.pdf
GB-T 33667-2017 高校毕业生就业指导服务规范.pdf
1
/
3
11
评价文档
赞助3元 点击下载(451.3 KB)
回到顶部
×
微信扫码支付
3
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。