-
公开(公告)号:CN119250161A
公开(公告)日:2025-01-03
申请号:CN202411778280.9
申请日:2024-12-05
Applicant: 西北工业大学
Abstract: 为解决当前追逃博弈智能决策中使用深度强化学习算法得到的神经网络可解释性和可调试性差,难以满足实际部署要求的问题,本发明提出一种基于模糊推理树的深度强化学习策略迁移方法。本发明以经过充分训练的待迁移网络为指导,通过智能优化算法对模糊推理树进行训练使其与训练好的待迁移网络在相同的输入下具有相同的输出,即使得模糊推理树学习到了状态到动作的映射关系,具有与深度强化学习的待迁移网络相同的决策能力,从而达到将深度强化学习算法中蕴含在神经网络内的规则抽取并迁移到模糊推理树的目的。本发明在不改变决策效能的前提下,提升了决策指令的生成速度,且解决了追逃博弈信息不完全可知、决策方法的可调试性和可解释性差的问题。