一种基于GRU-MAPPO深度强化学习的无人机协同空战决策方法

    公开(公告)号:CN119129413A

    公开(公告)日:2024-12-13

    申请号:CN202411249289.0

    申请日:2024-09-06

    Applicant: 厦门大学

    Inventor: 罗德林 陈才轶

    Abstract: 一种基于GRU‑MAPPO深度强化学习的无人机协同空战决策方法,涉及空战博弈机动策略。从复杂空战环境出发,对无人机的运动模型、机动动作、空战态势、奖励函数进行分析,建立多无人机空战环境模型,包括无人机质点运动模型、无人机机动动作模型、空战态势评估模型以及无人机奖励函数模型;针对完全合作的多智能体环境,建立部分可观测的马尔科夫决策链框架,采用集中训练分布执行的工作方式;针对无人机协同决策,将近端策略优化PPO算法拓展至多智能体领域,使用门控循环单元GRU代替原始算法中的全连接神经网络,得到适用于多智能体深度强化学习的GRU‑MAPPO算法;仿真实验表明本方法能提高无人机的协同决策能力和空战胜率。

Patent Agency Ranking