iso file download
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111170446.5 (22)申请日 2021.10.08 (71)申请人 天津大学 地址 300072 天津市卫津路9 2号 (72)发明人 宗群 卢燕梅 窦立谦 张秀云  张睿隆  (74)专利代理 机构 天津市北洋 有限责任专利代 理事务所 12 201 代理人 刘国威 (51)Int.Cl. G06Q 10/04(2012.01) G06K 9/62(2006.01) G06N 20/00(2019.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 基于机器学习和证据理论的机器人博弈战 术预测方法 (57)摘要 本发明涉及机器学习、 信息融合、 战术预测、 机器人博弈等领域, 为提出一种应用于机器人博 弈过程的不确定条件下的对手战术预测方法。 为 此, 本发明采取的技术方案是, 基于机器学习和 证据理论的机器人博弈战术预测方法, 利用机器 学习方法构造模型表示机器人状态数据和战术 结果之间的关系, 考虑到博弈环境的不确定性, 利用D‑S证据理论对不确定性进行处理, 将三种 机器学习算法获得的预测结果处理作为D ‑S证据 理论的基本概率赋值函数, 利用D ‑S证据理论在 信息融合方面的优势, 融合多方信息, 得出最终 的预测结果, 达到预测对手战术的目的。 本发明 主要应用于 机器人博弈场合。 权利要求书4页 说明书10页 附图2页 CN 113887807 A 2022.01.04 CN 113887807 A 1.一种基于机器学习和证据理论的机器人博弈战术预测方法, 其特征是, 利用机器学 习方法构造模型表示机器人状态数据和战术结果之间的关系, 考虑到博弈环境的不确定 性, 利用D ‑S证据理论对不确定性进 行处理, 将三种机器学习算法获得的预测结果处理作为 D‑S证据理论的基本概率赋值函数, 利用D ‑S证据理论在信息融合方面的优势, 融合多方信 息, 得出最终的预测结果, 达 到预测对手战术的目的。 2.如权利要求1所述的基于机器学习和证据理论的机器人博弈战术预测方法, 其特征 是, 具体步骤如下: 第一部分, 数据预处理, 包括数据缺失值和异常值处理, 文本数据替换, 数据类别不平 衡问题解决, 数据类别标注: 对采集的甲乙双方博弈过程的历史数据进 行数据预 处理, 去掉 和战术预测无关的一些参数, 同时剔除数据中的无效值和 错误值, 原始数据特征含有二值 文本型数据, 需要替换成数值型数据0或1, 对少数类样本进行扩充, 使行为 “发生”与“不发 生”的比率为1:1, 并将行为结果标注到数据集后面, 便 于进行机器学习算法的输入; 第二部分, 机器学习模型构建, 基于人工神经网络、 决策树、 逻辑回归三种单模型: 本发 明中, 选取12维甲方状态数据作为特征输入, 攻击行为 发生或不发生作为输出, 基于人工神 经网络、 决策树模型、 逻辑回归模型三种单模型进行学习, 12维输入特征主要包括甲方速 度、 加速度、 高度、 雷达锁定信号、 中制导信号, 基于机器学习 库sklear n库进行模型搭建: 对 于人工神经网络和逻辑回归模型, 首先将训练数据进行归一化处理, 之后输入模型进行训 练, 基于K折交叉验证方式调整模型参数, 得到预测准确度较高的模型; 决策树模型则不需 进行数据归一化处理, 直接基于原始数据进 行学习, 调整得到最优参数模型, 由此得到三种 不同机器学习方法下的预测模型; 第三部分, 基于D ‑S证据理论将三种单模型进行融合: 基于D ‑S证据理论在信息融合、 不 确定性处理方面的优势, 融合三种机器学习模 型的输出得到最终的预测结果, 基于sklear n 库的预测某类结果的概率predict_proba()方法可得到每个模型输出值的概率, 代表预测 为每个结果的可能性, 故将其作为三种模型输出的基本概率赋值, 得到三个证据体, 之后基 于D‑S证据融合公式计算出最终的对方战术行为预测结果。 3.如权利要求1所述的基于机器学习和证据理论的机器人博弈战术预测方法, 其特征 是, 详细步骤如下: 第一步, 数据预处理, 包括数据缺失值和异常值处理, 文本数据替换, 数据类别不平衡 问题解决, 数据类别标注: 对采集的甲乙双方博弈过程的历史数据进行预处理, 包括数据清洗、 特征处理, 剔除无 效值和异常值, 利用Python语 言对缺失值进 行替换, 替换成该字段的平均值或中位值, 将二 值文本型数据替换成数值型数据1/0, 针对数据类别不平衡问题, 利用合成少数过采样 SMOTE(Synthetic  Minority  Oversamplin g Technique)算法进行少数样本扩充, SMOTE算 法流程如下: 1)对于少数类中每一个样本x, 以欧式距离为标准计算它到少数类样本集Smin中所有样 本的距离, 得到其K近邻; 2)根据样本不平衡比例设置一个采样比例以确定采样倍率N, 对于每一个少数类样本 x, 从其K近邻中随机 选择若干个样本, 假设选择的近邻为xn; 3)对于每一个随机 选出的近邻xn, 分别与原样本按照如下的公式构建新的样本权 利 要 求 书 1/4 页 2 CN 113887807 A 2xnew=x+rand(0,1)*|x ‑xn|   (1) 最终得到的数据样本中, 甲方攻击行为发生: 不发生=1:1, 最后将行为结果标注到数 据集后面, 便 于进行机器学习算法的输入; 第二步, 机器学习模型构建, 基于人工神经网络、 决策树、 逻辑回归三种单模型 是受生物神经网络启发而构建的算法模型, 对噪声数据有较强的鲁棒性和容错能力, 能充分逼近复杂的非线性关系等优点, 但是同时具有需要训练大量参数, 模型黑盒特性难 以解释内部机制, 学习时间过长, 训练不到位预测结果较差等缺点; 是if ‑then规则的集合, 基于训练数据集学习使用一个决策树作为预测模型, 其中每个内部节点代表一个属性上的 测试, 每个分支代表一个测试输出, 每个叶节点代表一种类别, 相比其他机器学习算法, 其 优点在于决策树易于理解和实现, 不需要 数据归一化, 能够同时处理数据型和常规型属性, 对缺失值不敏感, 训练 时间短等特点, 缺点在于对连续性字段比较难以预测, 对于有时间顺 序的数据需要许多预处理的工作, 容易趋 向过拟合及陷入局部最小值等; 逻辑回归算法是 针对分类问题建立代价函数, 然后通过优化方法迭代求解出最优的模型参数, 之后利用模 型进行分类, 其优点在于实现简单且易于理解, 尤其适合于二分类问题, 缺点在于要求严格 的假设, 对数据和场景的适应能力有局限性, 容 易欠拟合导致分类精度一般不高等。 基于人工神经网络、 决策树模型和逻辑回归算法分别建立预测模型, 之后利用D ‑S证据 进行融合, 最终建立模型相关参数; 第三步, 基于D ‑S证据理论将三种单模型进行融合。 基于机器学习库sklearn分别建立 三种模型, 之后基于predict_proba()方法获取三种模型的概率输出值, 作为每种方法的 证据体, 通过D ‑S证据融合 公式计算出最 终的预测模型对攻击行为是否发生的预测结果, 基 于D‑S证据理论进行融合决策的基本步骤: 1)定义识别框架 D‑S证据理论建立在一个通用的非空集合上, 该集合包括人们对某一决策问题所能考 虑到的所有结果, 称之为识别框架(Frame  of Discernment,FoD), 定义识别框架Θ为一组 包含M个互斥且穷举的命题集 合, 且该集 合为有限集; Θ={H1,H2,...,HM}    (2) 其中M为总的命题个数, Hi(i=1,2,...,M)表示FoD中的第i个命题; 可能的结果 为攻击行为“发生”或“不发生”, 则FoD为Θ={H1,H2}={不发生,发生}。 在FoD的基础上, 定义 其幂集2Θ: 其中, 表示空集。 由公式(3)可 以看出, FoD的子集都属于其幂集, 即幂集包含2M个元 素; 2)基本概 率赋值函数与证据体获取 基本概率赋值BPA(Basic  Probabilit y Assignment)函数表示证据体对命题的最初信 任程度, 是证据理论描述命题的基本单元, 在决策系统中, 任意命题H都是FoD的子集, 属于 幂集2Θ, 即 BPA的定义 为m:2Θ→1, 即从FoD的幂集到[0,1]的映射, 满足权 利 要 求 书 2/4 页 3 CN 113887807 A 3

.PDF文档 专利 基于机器学习和证据理论的机器人博弈战术预测方法

文档预览
中文文档 17 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于机器学习和证据理论的机器人博弈战术预测方法 第 1 页 专利 基于机器学习和证据理论的机器人博弈战术预测方法 第 2 页 专利 基于机器学习和证据理论的机器人博弈战术预测方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-19 02:01:55上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。