Patent search ap:("哈尔滨工程大学") AND inv:"孙瑞涵" Page 1

1.

发明公开
一种基于深度强化学习的智能空战决策方法及系统审中-实审

公开(公告)号：CN118396112A

公开(公告)日：2024-07-26

申请号：CN202410498629.7

申请日：2024-04-24

Applicant: 哈尔滨工程大学

Inventor： 王兴梅 , 胥周 , 刘佳奇 , 孙瑞涵 , 李昊天 , 李博权

IPC: G06N5/04 , G06N5/025 , G06N3/092 , G06N3/045

Abstract: 本发明公开了一种基于深度强化学习的智能空战决策方法及系统，包括以下步骤：构建基于深度强化学习的多机空战博弈框架；在MAPPO算法的基础上引入双中心网络策略、延迟更新优化策略和分步训练策略，获得MAPPO_LDDC算法；基于所述MAPPO_LDDC算法，构建空战决策模型；利用所述多机空战博弈框架，训练所述空战决策模型；利用训练好的所述空战决策模型，完成智能空战决策。本发明能有效地从环境中获得奖励，取得高胜率。同时在获得奖励的过程中表现出较好的稳定性，进一步提升了空战中无人机的决策能力，具有一定的有效性。

Patent Agency Ranking