一种基于元强化学习的无人机集群抗干扰通信方法

    公开(公告)号:CN119519884A

    公开(公告)日:2025-02-25

    申请号:CN202411521389.4

    申请日:2024-10-29

    Abstract: 本发明公开了一种基于元强化学习的无人机集群抗干扰通信方法,该方法为:构建无人机集群抗干扰通信环境,初始化网络参数,生成多个元强化学习任务;从元训练集抽样任务,初始化环境、经验池、上下文采样池;各无人机将与环境交互的观测数据输入至用于上下文任务推理的编码器和长短期记忆网络模块,得到上下文任务信息和历史记忆,将其与智能体的当前观测拼接,作为双深度递归Q网络即DDRQN的输入,预测动作并与环境交互;最后判断环境是否达到最大训练步长,若达到则结束当前回合,进入元测试阶段;否则重复进行下一轮的训练。本发明具有可扩展性强、泛化性能强、学习效率高、稳定性强、传输能量损耗低、跳频开销少、网络寿命长的优点。

Patent Agency Ranking