基于元学习和MADDPG的无人机编队协同决策方法

    公开(公告)号:CN117111632A

    公开(公告)日:2023-11-24

    申请号:CN202311021266.X

    申请日:2023-08-14

    Abstract: 本发明公开了基于元学习和MADDPG的无人机编队协同决策方法,涉及无人机领域。本发明实现了跨任务的端到端的UAV编队协同决策,在训练任务上训练后能够快速、稳定地应用于新任务场景,而Reward‑TD优先经验重放方法,提升算法的收敛速度和经验利用率,在优先经验重放过程中基于即时奖励和TD‑error确定经验重放优先级,提升经验重放质量,而在MW‑MADDPG算法和Reward‑TD经验优先重放方法基础上提出了遗忘机制,提高算法鲁棒性并减少过拟合现象,设置采样次数阈值,减少少部分经验反复重放,综上,该基于元学习和MADDPG的无人机编队协同决策方法优于传统方法,且泛化性较好,能够克服传统方法中的冷启动问题,将应用于更大规模场景,为解决跨任务异质无人机群突防问题提供了解决思路。

Patent Agency Ranking