-
公开(公告)号:CN119129413A
公开(公告)日:2024-12-13
申请号:CN202411249289.0
申请日:2024-09-06
Applicant: 厦门大学
IPC: G06F30/27 , G06N3/0442 , G06N3/092 , G06F119/14
Abstract: 一种基于GRU‑MAPPO深度强化学习的无人机协同空战决策方法,涉及空战博弈机动策略。从复杂空战环境出发,对无人机的运动模型、机动动作、空战态势、奖励函数进行分析,建立多无人机空战环境模型,包括无人机质点运动模型、无人机机动动作模型、空战态势评估模型以及无人机奖励函数模型;针对完全合作的多智能体环境,建立部分可观测的马尔科夫决策链框架,采用集中训练分布执行的工作方式;针对无人机协同决策,将近端策略优化PPO算法拓展至多智能体领域,使用门控循环单元GRU代替原始算法中的全连接神经网络,得到适用于多智能体深度强化学习的GRU‑MAPPO算法;仿真实验表明本方法能提高无人机的协同决策能力和空战胜率。