-
公开(公告)号:CN115345066A
公开(公告)日:2022-11-15
申请号:CN202210808933.8
申请日:2022-07-11
IPC: G06F30/27 , G06N20/00 , G06F111/04 , G06F111/06
Abstract: 本发明的一种基于强化学习的多目标集群拦截智能分配方法,基于弹目相对角度评估拦截器对不同目标的优势度并建立角度优势模型,利用待飞时间评估目标的威胁度并建立目标威胁模型,以角度优势模型和目标威胁模型为基础建立综合拦截优势度模型;以Q‑学习逻辑进行强化学习,并基于Q‑学习的多目标分配,所述基于Q‑学习的多目标分配包含行为策略、动作空间、状态空间以及回报函数的设计。该基于强化学习的多目标集群拦截智能分配方法,解决多目标拦截高动态决策问题。