Patent search ap:("中国人民解放军空军工程大学") AND inv:"杨可真" Page 1

1.

发明公开
基于元学习和MADDPG的无人机编队协同决策方法审中-实审

公开(公告)号：CN117111632A

公开(公告)日：2023-11-24

申请号：CN202311021266.X

申请日：2023-08-14

Applicant: 中国人民解放军空军工程大学

Inventor： 赵敏睿 , 王刚 , 王宁 , 杨可真 , 杨科 , 刘祥雨

IPC: G05D1/10

Abstract: 本发明公开了基于元学习和MADDPG的无人机编队协同决策方法，涉及无人机领域。本发明实现了跨任务的端到端的UAV编队协同决策，在训练任务上训练后能够快速、稳定地应用于新任务场景，而Reward‑TD优先经验重放方法，提升算法的收敛速度和经验利用率，在优先经验重放过程中基于即时奖励和TD‑error确定经验重放优先级，提升经验重放质量，而在MW‑MADDPG算法和Reward‑TD经验优先重放方法基础上提出了遗忘机制，提高算法鲁棒性并减少过拟合现象，设置采样次数阈值，减少少部分经验反复重放，综上，该基于元学习和MADDPG的无人机编队协同决策方法优于传统方法，且泛化性较好，能够克服传统方法中的冷启动问题，将应用于更大规模场景，为解决跨任务异质无人机群突防问题提供了解决思路。

Patent Agency Ranking