iso file download
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111188450.4 (22)申请日 2021.10.12 (71)申请人 江苏科技大学 地址 212003 江苏省镇江市梦溪路2号江苏 科技大学科技处 (72)发明人 刘玮 束鑫 叶华 (74)专利代理 机构 南京经纬专利商标代理有限 公司 32200 代理人 徐澍 (51)Int.Cl. G06F 16/35(2019.01) G06F 40/284(2020.01) G06K 9/62(2022.01) G06N 20/00(2019.01) G06Q 30/02(2012.01) (54)发明名称 基于机器学习的商家评论分析系统及方法 (57)摘要 本发明公开了一种基于机器学习的商家评 论分析系统, 包括: 数据处理层、 机器学习算法 层、 用户服务层; 所述数据处理层, 用于获取平台 数据, 对平台数据进行预处理、 文本分词及词云 生成, 输出评价数据集; 所述机器学习算法层, 使 用评论数据集进行模型训练、 情感分析、 聚类分 析, 输出评价数据的情感积极度、 商家分类标签; 所述用户服务层, 向用户提供商家 推荐、 搜索、 分 类、 商家数据分析、 评论数据分析信息。 本发明采 用机器学习算法分析用户评论数据, 量化用户情 感数据, 挖掘评论中用户的情绪与态度, 能够精 细化商家评价, 弥补了平台评分的短板, 构建多 维度评分模型, 实现了更加精准的商家评价体 系。 权利要求书2页 说明书7页 附图4页 CN 113987168 A 2022.01.28 CN 113987168 A 1.一种基于机器学习的商家评论分析系统, 其特征在于, 包括: 数据处理层、 机器学习 算法层、 用户服 务层; 所述数据处理层, 用于获取平台数据, 对平台数据进行预处理、 文本分词及词云生成, 输出评价数据集; 所述机器学习算法层, 使用评论数据集进行模型训练、 情感分析、 聚类分析, 输出评价 数据的情感积极度、 商家分类标签; 所述用户服务层, 向用户提供商家推荐、 搜索、 分类、 商家数据分析、 评论数据分析信 息。 2.如权利要求1所述的基于机器学习的商家评论分析系统, 其特征在于, 所述数据处理 层包括: 数据获取模块、 数据处 理模块; 所述数据获取模块, 用于对不同平台的用户评论进行数据爬取, 并将原始数据进行分 类整理、 存 储; 所述数据处 理模块, 用于 评价数据预处 理、 文本分词、 文本向量 化, 以及词云的生成。 3.如权利要求1或2所述的基于机器学习的商家评论分析系统, 其特征在于, 所述机器 学习算法层包括: 模型训练模块、 情感分析模块、 聚类分析及标签生成模块; 所述模型训练模块, 使用所述数据处理层输出的评价数据, 并采用人工标记的方式对 朴素贝叶斯模型进行训练; 所述情感分析模块, 使用朴素贝叶斯模型计算情感积极度; 所述聚类分析及标签生成模块, 采用改进k ‑means算法对情感分析后的评论数据进行 聚类分析, 并绑定标签。 4.一种基于 机器学习的商家评论分析系统的分析 方法, 其特 征在于, 包括如下步骤: 步骤1: 采用爬虫技 术抓取平台的用户评论数据、 商家数据; 步骤2: 对商家数据、 用户评论数据进行 预处理; 步骤3: 对预处理后的商家数据、 用户评论数据进行文本分词、 文本向量化、 文本特征提 取, 输出训练样本; 步骤4: 使用所述训练样本训练朴素贝叶斯模型; 步骤5: 使用训练后的朴素贝叶斯模型分析用户评论数据的情感倾向; 步骤6: 对商家数据与用户评论数据进行聚类分析; 步骤7: 根据聚类分析 结果、 情感倾向, 生成用户评论数据标签和词云, 完成评论分析。 5.如权利要求4所述的基于机器学习的商家评论分析系统的分析方法, 其特征在于, 所 述步骤3的具体方法如下: 运用词典的前缀扫描中文分词, 生成句子中汉字所有可能成词情况所构 成的有向无环 图, 完成文本分词; 将分词结果使用TF ‑IDF算法获取特征矩阵, 对特征矩阵的维度的权重进行修正后获取 分词的TF ‑IDF值作为文本特 征; 设置停用词, 去除特 征矩阵与TF ‑IDF值中的停用词后作为训练集输出。 6.如权利要求4所述的基于机器学习的商家评论分析系统的分析方法, 其特征在于, 所 述步骤4的具体方法如下: 模型训练依据训练集计算每个类别在训练样本中的出现频率及每个特征属性划分对权 利 要 求 书 1/2 页 2 CN 113987168 A 2每个类别的条件概 率估计, 并将结果记录 。 所用公式如下: 其中, b1, b2, ..., bn为一条评论的n个 特征向量, 且在概率分布上是条件独立的, P(A|b1, b2, ..., bn)代表一条评论的情感概率, P(A)代表模型训练后的情感概率, P(bi|A)代表每个 特征向量的条件概 率; 所得到的概率结果集即作为后 续进行最大似然估计的依赖, 最终情 感分析依据 该结果 集进行计算。 7.如权利要求4所述的基于机器学习的商家评论分析系统的分析方法, 其特征在于, 所 述步骤5的具体方法如下: 提取用户评论数据的所有特征值F1到Fn的n个特征值, 通过朴素贝叶斯模型获取所有特 征值的分布概 率, 将概率最高的预测作为情感倾向输出。 8.如权利要求7所述的基于机器学习的商家评论分析系统的分析方法, 其特征在于, 所 述通过朴素贝叶斯模型获取 所有特征值的分布概 率的方法如下: 根据n个特 征值各自的分布概 率, 将其代入到下式 中进行k次运 算: 其中, P(Fi=fi|Cj=cj)为第i个特征值的条件概率, P(C=Cj)为步骤4中所得结果集的k 种情况的发生 概率; 比较这k次的结果, 选出使得运 算结果达 到最大值的预测作为情感倾向值输出。 9.如权利要求7所述的基于机器学习的商家评论分析系统的分析方法, 其特征在于, 所 述通过朴素贝叶斯模型获取 所有特征值的分布概 率的方法如下: 根据n个特 征值各自的分布概 率, 将其代入到下式 中进行k次运 算: 其中P(y=ck)为训练后的模型中k种情况的概率, P(xi|y=ck)为第k种特征值的条件概 率; 比较这k次的结果, 选出使得运 算结果达 到最大值的预测作为情感倾向值输出。 10.如权利要求4所述的基于机器学习的商家评论分析系统的分析方法, 其特征在于, 所述步骤6的具体方法如下: 采用改进后的k ‑means算法对商家数据与用户评论数据进行聚类分析, 其中, 所述改进后的k ‑means算法的步骤如下: 步骤1: 初始化 k个簇中心值; 步骤2: 进行k ‑means聚类, 获得聚类后的k个簇中心值。 进行一次k ‑means聚类的k个簇 中心值称为 一组簇中心值; 步骤3: 将每一次生成的一组簇中心值, 分配至k个簇中心集合中。 分配的原则为k个生 成的簇中心值与对应簇中心集 合的平均值的方差最小; 步骤4: 经过N次k ‑means聚类后, k个簇中心集合中, 均有k个簇中心数值, 将其平均之 后, 得到最终的聚类簇中心数据。权 利 要 求 书 2/2 页 3 CN 113987168 A 3
专利 基于机器学习的商家评论分析系统及方法
文档预览
中文文档
14 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助3元下载(无需注册)
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助3元下载
本文档由 人生无常 于
2024-03-19 02:01:56
上传分享
举报
下载
原文档
(613.5 KB)
分享
友情链接
DB51-T 2917-2022 县域智慧旅游城市建设指南 四川省.pdf
GB-T 30069.1-2013 金属材料 高应变速率拉伸试验 第1部分 弹性杆型系统.pdf
GB-T 14463-2022 粘胶短纤维.pdf
思度安全-DSMM-018 数据发布安全管理规范V1.0.pdf
GB 31338-2014 工业硅单位产品能源消耗限额.pdf
DB65-T 4529—2022 三相异步电动机节能监测 新疆维吾尔自治区.pdf
GB-T 23022-2022 信息化和工业化融合管理体系 生产设备运行管理规范.pdf
GB-T 30101-2013 聚乙烯醇水溶短纤维.pdf
GB-T 16632-2019 水处理剂阻垢性能的测定 碳酸钙沉积法.pdf
DB43-T 2091-2021 烤烟与半夏套种技术规程 湖南省.pdf
GB-T 43156-2023 地理信息 矢量数据模型与存储规范.pdf
GB 42250-2022 信息安全技术 网络安全专用产品安全技术要求.pdf
GB-T 3778-2021 橡胶用炭黑.pdf
T-CPUMT 006—2022 工业数据安全事件应急预案编制指南.pdf
TTAF 180.4—2023 小程序个人信息保护规范 第4部分:全生命周期.pdf
绿盟 新型IoT机顶盒恶意软件Rowdy网络分析报告.pdf
SCIE 004-2021 智慧城市产业生态圈联盟标准.pdf
T-CACM 1065—2018 中药DNA分子鉴定试剂盒 定性 评价技术要求.pdf
GB-T 43206-2023 信息安全技术 信息系统密码应用测评要求.pdf
民航 MH-T 0026-2005 民用航空重要信息系统灾难备份与恢复管理规范.pdf
1
/
3
14
评价文档
赞助3元 点击下载(613.5 KB)
回到顶部
×
微信扫码支付
3
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。