一种基于启发式强化学习的反导防御系统火力分配方法

    公开(公告)号:CN115018166A

    公开(公告)日:2022-09-06

    申请号:CN202210656653.X

    申请日:2022-06-10

    Abstract: 本发明公开了一种基于启发式强化学习的反导防御系统火力分配方法。本发明首先将WTA问题转化为一个多步决策问题,在深度Q网络框架下建立火力分配方法;构建火力单元状态集、目标库和经验池,引入了公平采样策略,确保等概率学习各目标分配经验;引入了基于SA‑PSO的启发式火力分配优化方法对ε‑greedy机制进行改进,通过火力分配优化方法进行单步决策从而获得较优的火力分配经验,提高DQN模型训练效率和决策能力;设计了兼顾快速收敛和全局收益的奖励函数,引导DQN训练过程更加注重全局的整体毁伤概率收益。本发明通过模拟火力分配环境训练DQN模型,利用该模型快速处理中大规模WTA问题,兼具决策的快速性和准确性。

Patent Agency Ranking