(19)中华 人民共和国 国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202111170446.5
(22)申请日 2021.10.08
(71)申请人 天津大学
地址 300072 天津市卫津路9 2号
(72)发明人 宗群 卢燕梅 窦立谦 张秀云
张睿隆
(74)专利代理 机构 天津市北洋 有限责任专利代
理事务所 12 201
代理人 刘国威
(51)Int.Cl.
G06Q 10/04(2012.01)
G06K 9/62(2006.01)
G06N 20/00(2019.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
基于机器学习和证据理论的机器人博弈战
术预测方法
(57)摘要
本发明涉及机器学习、 信息融合、 战术预测、
机器人博弈等领域, 为提出一种应用于机器人博
弈过程的不确定条件下的对手战术预测方法。 为
此, 本发明采取的技术方案是, 基于机器学习和
证据理论的机器人博弈战术预测方法, 利用机器
学习方法构造模型表示机器人状态数据和战术
结果之间的关系, 考虑到博弈环境的不确定性,
利用D‑S证据理论对不确定性进行处理, 将三种
机器学习算法获得的预测结果处理作为D ‑S证据
理论的基本概率赋值函数, 利用D ‑S证据理论在
信息融合方面的优势, 融合多方信息, 得出最终
的预测结果, 达到预测对手战术的目的。 本发明
主要应用于 机器人博弈场合。
权利要求书4页 说明书10页 附图2页
CN 113887807 A
2022.01.04
CN 113887807 A
1.一种基于机器学习和证据理论的机器人博弈战术预测方法, 其特征是, 利用机器学
习方法构造模型表示机器人状态数据和战术结果之间的关系, 考虑到博弈环境的不确定
性, 利用D ‑S证据理论对不确定性进 行处理, 将三种机器学习算法获得的预测结果处理作为
D‑S证据理论的基本概率赋值函数, 利用D ‑S证据理论在信息融合方面的优势, 融合多方信
息, 得出最终的预测结果, 达 到预测对手战术的目的。
2.如权利要求1所述的基于机器学习和证据理论的机器人博弈战术预测方法, 其特征
是, 具体步骤如下:
第一部分, 数据预处理, 包括数据缺失值和异常值处理, 文本数据替换, 数据类别不平
衡问题解决, 数据类别标注: 对采集的甲乙双方博弈过程的历史数据进 行数据预 处理, 去掉
和战术预测无关的一些参数, 同时剔除数据中的无效值和 错误值, 原始数据特征含有二值
文本型数据, 需要替换成数值型数据0或1, 对少数类样本进行扩充, 使行为 “发生”与“不发
生”的比率为1:1, 并将行为结果标注到数据集后面, 便 于进行机器学习算法的输入;
第二部分, 机器学习模型构建, 基于人工神经网络、 决策树、 逻辑回归三种单模型: 本发
明中, 选取12维甲方状态数据作为特征输入, 攻击行为 发生或不发生作为输出, 基于人工神
经网络、 决策树模型、 逻辑回归模型三种单模型进行学习, 12维输入特征主要包括甲方速
度、 加速度、 高度、 雷达锁定信号、 中制导信号, 基于机器学习 库sklear n库进行模型搭建: 对
于人工神经网络和逻辑回归模型, 首先将训练数据进行归一化处理, 之后输入模型进行训
练, 基于K折交叉验证方式调整模型参数, 得到预测准确度较高的模型; 决策树模型则不需
进行数据归一化处理, 直接基于原始数据进 行学习, 调整得到最优参数模型, 由此得到三种
不同机器学习方法下的预测模型;
第三部分, 基于D ‑S证据理论将三种单模型进行融合: 基于D ‑S证据理论在信息融合、 不
确定性处理方面的优势, 融合三种机器学习模 型的输出得到最终的预测结果, 基于sklear n
库的预测某类结果的概率predict_proba()方法可得到每个模型输出值的概率, 代表预测
为每个结果的可能性, 故将其作为三种模型输出的基本概率赋值, 得到三个证据体, 之后基
于D‑S证据融合公式计算出最终的对方战术行为预测结果。
3.如权利要求1所述的基于机器学习和证据理论的机器人博弈战术预测方法, 其特征
是, 详细步骤如下:
第一步, 数据预处理, 包括数据缺失值和异常值处理, 文本数据替换, 数据类别不平衡
问题解决, 数据类别标注:
对采集的甲乙双方博弈过程的历史数据进行预处理, 包括数据清洗、 特征处理, 剔除无
效值和异常值, 利用Python语 言对缺失值进 行替换, 替换成该字段的平均值或中位值, 将二
值文本型数据替换成数值型数据1/0, 针对数据类别不平衡问题, 利用合成少数过采样
SMOTE(Synthetic Minority Oversamplin g Technique)算法进行少数样本扩充, SMOTE算
法流程如下:
1)对于少数类中每一个样本x, 以欧式距离为标准计算它到少数类样本集Smin中所有样
本的距离, 得到其K近邻;
2)根据样本不平衡比例设置一个采样比例以确定采样倍率N, 对于每一个少数类样本
x, 从其K近邻中随机 选择若干个样本, 假设选择的近邻为xn;
3)对于每一个随机 选出的近邻xn, 分别与原样本按照如下的公式构建新的样本权 利 要 求 书 1/4 页
2
CN 113887807 A
2xnew=x+rand(0,1)*|x ‑xn| (1)
最终得到的数据样本中, 甲方攻击行为发生: 不发生=1:1, 最后将行为结果标注到数
据集后面, 便 于进行机器学习算法的输入;
第二步, 机器学习模型构建, 基于人工神经网络、 决策树、 逻辑回归三种单模型
是受生物神经网络启发而构建的算法模型, 对噪声数据有较强的鲁棒性和容错能力,
能充分逼近复杂的非线性关系等优点, 但是同时具有需要训练大量参数, 模型黑盒特性难
以解释内部机制, 学习时间过长, 训练不到位预测结果较差等缺点; 是if ‑then规则的集合,
基于训练数据集学习使用一个决策树作为预测模型, 其中每个内部节点代表一个属性上的
测试, 每个分支代表一个测试输出, 每个叶节点代表一种类别, 相比其他机器学习算法, 其
优点在于决策树易于理解和实现, 不需要 数据归一化, 能够同时处理数据型和常规型属性,
对缺失值不敏感, 训练 时间短等特点, 缺点在于对连续性字段比较难以预测, 对于有时间顺
序的数据需要许多预处理的工作, 容易趋 向过拟合及陷入局部最小值等; 逻辑回归算法是
针对分类问题建立代价函数, 然后通过优化方法迭代求解出最优的模型参数, 之后利用模
型进行分类, 其优点在于实现简单且易于理解, 尤其适合于二分类问题, 缺点在于要求严格
的假设, 对数据和场景的适应能力有局限性, 容 易欠拟合导致分类精度一般不高等。
基于人工神经网络、 决策树模型和逻辑回归算法分别建立预测模型, 之后利用D ‑S证据
进行融合, 最终建立模型相关参数;
第三步, 基于D ‑S证据理论将三种单模型进行融合。 基于机器学习库sklearn分别建立
三种模型, 之后基于predict_proba()方法获取三种模型的概率输出值, 作为每种方法的
证据体, 通过D ‑S证据融合 公式计算出最 终的预测模型对攻击行为是否发生的预测结果, 基
于D‑S证据理论进行融合决策的基本步骤:
1)定义识别框架
D‑S证据理论建立在一个通用的非空集合上, 该集合包括人们对某一决策问题所能考
虑到的所有结果, 称之为识别框架(Frame of Discernment,FoD), 定义识别框架Θ为一组
包含M个互斥且穷举的命题集 合, 且该集 合为有限集;
Θ={H1,H2,...,HM} (2)
其中M为总的命题个数, Hi(i=1,2,...,M)表示FoD中的第i个命题;
可能的结果 为攻击行为“发生”或“不发生”, 则FoD为Θ={H1,H2}={不发生,发生}。
在FoD的基础上, 定义 其幂集2Θ:
其中,
表示空集。 由公式(3)可 以看出, FoD的子集都属于其幂集, 即幂集包含2M个元
素;
2)基本概 率赋值函数与证据体获取
基本概率赋值BPA(Basic Probabilit y Assignment)函数表示证据体对命题的最初信
任程度, 是证据理论描述命题的基本单元, 在决策系统中, 任意命题H都是FoD的子集, 属于
幂集2Θ, 即
BPA的定义 为m:2Θ→1, 即从FoD的幂集到[0,1]的映射, 满足权 利 要 求 书 2/4 页
3
CN 113887807 A
3
专利 基于机器学习和证据理论的机器人博弈战术预测方法
文档预览
中文文档
17 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-19 02:01:55上传分享