一种针对组网雷达对抗的多干扰机智能频域干扰决策方法

    公开(公告)号:CN116542317A

    公开(公告)日:2023-08-04

    申请号:CN202310346205.4

    申请日:2023-04-03

    Abstract: 本发明公开了一种针对组网雷达对抗的多干扰机智能频域干扰决策方法,构建多干扰机智能协同干扰模型,将对抗过程建立为多智能体强化学习的马尔可夫决策过程,采用集中学习范式建立对抗整体系统;按照分层强化学习的思想将频域干扰参数决策器的总任务进行分解,每个子任务的策略由划分的任务层次学习获得,将多个子任务的策略进行组合,形成有效的全局策略;分别定义决策引擎的三个空间模块,采用PER‑DDQN作为网络基础结构,输出决策策略;在网络优化模块引入优先级辅助经验回放,采用SumTree数据结构作为样本回放的经验池,依据函数、参数更新公式对深度神经网络参数进行更新。本发明采用带有优先经验重放的深度强化学习算法提高了网络的训练速度。

Patent Agency Ranking