基于动态非零和博弈的无人机集群协同对抗方法研究
来源:用户上传
作者:刘莎 张硕 刘禄
摘要:无人机集群协同对抗是当今国内外学术研究的热点问题,动态机动决策是无人机对抗最重要的研究领域之一。本文提出了一种基于动态非零和博弈的无人机集群协同对抗决策算法。首先,确定对抗双方的决策集,并通过角度、速度和距离等机动因素构造对抗双方的态势优势。其次,对无人机集群机动可选方案进行多属性评价,进一步计算双方的动态收益矩阵,建立动态非零和纳什均衡机动决策模型。随后,提出了改进的粒子群算法,高效求解动态非零和纳什均衡机动决策模型,得到最优的混合策略。最后,通过仿真试验验证了所提出的协同动态机动决策算法的优越性,有效提升了无人机集群协同对抗能力,为无人机集群指挥、决策及控制的智能化发展提供了理论及应用基础。
关键词:无人机集群;协同对抗;动态博弈;非零和博弈;纳什均衡
中图分类号:O225文献标识码:ADOI:10.19452/j.issn1007-5453.2022.02.012
随着无人机技术的快速发展,无人机已广泛应用于农业、航拍、测绘、运输、救援甚至是军事领域。在此基础上,无人机集群技术也得到了一定的发展,如无人机集群灯火表演、野生动植物观察等[1-6]。在无人机集群对抗领域,目前相关研究仍处在初期发展阶段,其主要的难点在于如何摆脱传统人为的路径规划,进而实现集群自身的智能化决策和自适应协同。此外,如何在动态的对抗过程中实现协同机动对抗智能决策的优化也是无人机集群协同对抗中的一个重要问题。
目前,无人机集群对抗领域已取得一些建设性的研究成果。惠一楠等[7]利用不完全信息动态博弈模型,使用免疫进化算法求解模型的贝叶斯纳什均衡解,得到无人机的最优策略序列。姚宗信[8]通过建立基于多智能体的多机协同作战任务决策方法结构模型,运用基于神经网络和静态博弈模型的多机协同对抗多目标任务决策方法,实现了多机协同对抗多目标任务决策方法仿真研究。近几年,无人机集群协同对抗开始使用态势实时分析和动态博弈的思想开展研究。邵将等[9]通过建立多无人机协同空战连续决策过程,使用贝叶斯推论对空战态势进行实时评估,并以此设计的决策规则进行机动决策。陈侠等[10-11]通过建立无人机的能力函数,建立多无人机协同打击任务的攻防博弈模型,给出了有限策略静态博弈模型与纯策略纳什均衡的求解方法。由上述研究可以看出,针对无人机集群的能力和实时态势分析是集群动态协同对抗的模型基础[12]。但由于对抗双方目标策略的不同,实际上双方的对抗并不是零和博弈,而更符合非零和博弈的特征。
基于上述分析,本文针对无人机集群协同对抗问题,通过双方的态势分析对决策集进行多属性评价和目标策略选择,建立双方的动态非零和纳什均衡机动决策模型。进一步通过改进的粒子群算法,实现非零和博弈模型的纳什均衡解的高效计算,得出双方的最优混合策略。最后,通过数值仿真试验验证所提方法的有效性。
1动态非零和纳什均衡机动决策建模
1.1机动策略
1.3.3动态纳什均衡决策模型
上两节给出了F和G双方单位时间的非零和博弈过程。由于双方的博弈为动态过程,因此需要建立动态的纳什均衡决策模型。主要的步骤分为以下几步:(1)在给定双方初始位置姿态和性能参数后,确定双方对抗的总时长T、当前时间t以及单次博弈的单位时长Δt;(2)根据当前双方的位置姿态,在不同的策略组合下,计算双方个体间距离优势、速度优势以及角度优势,得到整体的总体态势函数,根据当前的集群策略目标计算双方的收益矩阵,建立非零和博弈模型;(3)求解非零和博弈模型的纳什均衡解得出双方的最优混合策略;(4)根据求得的混合策略随机得出下一步的策略,得到下一步的位置和姿态;(5)将时间更新为t +Δt,判断是否t +Δt > T或双方已达到停止博弈条件(如一方以实现绝对优势条件);如果是,进行第(6)步;如果不是,进行第(2)步;(6)博弈对抗结束,判断博弈结果。
2动态非零和纳什均衡策略的优化
上一节已经给出了无人机集群协同对抗的动态非零和纳什均衡机动决策模型及其具体步骤。如1.3.3节所示,步骤中最核心的问题是第3项“求解非零和博弈模型的纳什均衡解得出双方的最优混合策略”,即榍蠼庾钣呕问题式(20)。
在实践中,粒子常常陷入局部最优,所提出的参数优化算法应该能够改变其原始轨迹,以适应性地探索新的解空间。式(23)中所用的rand1,rand2随机数,无法克服随机进化搜索中的盲目性,无法进一步实现粒子的高效搜索。近年来,许多研究表明,如果粒子收敛太快,它们将在几代内局部最优收缩[15]。这种现象将导致个人之间相似的搜索行为,并导致多样性的丧失。如果粒子被困在局部区域,则由于它们相似的搜索行为和缺乏自适应检测能力,它们将很难跳出局部最优。为了提高随机搜索的多样性,在改进的粒子群算法中我们使用Levy过程作为随机搜索的随机过程。Levy过程是比Brownian运动、Poisson运动更广泛的一类随机过程,属于一类重尾过程,现已广泛应用于搜索、经济、金融等数学模型,具有较强的漂移搜索能力。因此,在已有的模型中加入Levy过程能提高算法的随机搜索能力,改善PSO算法的性能,引导粒子移动到希望成为全局最优值的不同区域,并更广泛地探索求解空间。
nlc202204181003
转载注明来源:https://www.xzbu.com/1/view-15428567.htm