基于最大熵强化学习算法的模型训练方法及规划制导方法

    公开(公告)号:CN118607613B

    公开(公告)日:2024-12-24

    申请号:CN202411075546.3

    申请日:2024-08-07

    Applicant: 南开大学

    Abstract: 本发明提供一种基于最大熵强化学习算法的模型训练方法及规划制导方法,包括:构建动作评论模型,动作评论模型包括行动网络模块和评论网络模块;动作评论模型根据状态向量得到决策过程向量组,状态向量为从预设环境中得到的;根据决策过程向量组,在最大化熵原则下更新行动网络模块和所述评论网络模块,输出最优策略结果。本发明在最大化熵原则下,避免对整体空间进行计算,大大减少了学习的复杂性。

    一种飞行器末段预定时间滑模制导方法

    公开(公告)号:CN119247757B

    公开(公告)日:2025-04-08

    申请号:CN202410232226.8

    申请日:2024-03-01

    Applicant: 南开大学

    Abstract: 本发明涉及非电变量的控制或调节技术领域,尤其涉及一种飞行器末段预定时间滑模制导方法,包括如下步骤:建立三维耦合相对运动模型;使#imgabs0#和#imgabs1#在预定的时间内收敛到期望的角度;构建制导律设计目标,并得到简化的三维耦合相对运动模型;定义预定时间滑模面,并获得预定时间制导律模型;对目标的扰动向量及目标加速度所带来外部扰动估计,并求解预定时间制导律;对简化的三维耦合相对运动模型求解,得到飞行器的运动状态信息;飞行器控制系统控制制导跟踪目标。本发明提供的方法能够保证系统在预定时间内收敛,同时固定时间干扰观测器模型可以实现对目标所引起的外部扰动的估计,具有较高的命中精度。

    一种飞行器末段预定时间滑模制导方法

    公开(公告)号:CN119247757A

    公开(公告)日:2025-01-03

    申请号:CN202410232226.8

    申请日:2024-03-01

    Applicant: 南开大学

    Abstract: 本发明涉及非电变量的控制或调节技术领域,尤其涉及一种飞行器末段预定时间滑模制导方法,包括如下步骤:建立三维耦合相对运动模型;使#imgabs0#和#imgabs1#在预定的时间内收敛到期望的角度;构建制导律设计目标,并得到简化的三维耦合相对运动模型;定义预定时间滑模面,并获得预定时间制导律模型;对目标的扰动向量及目标加速度所带来外部扰动估计,并求解预定时间制导律;对简化的三维耦合相对运动模型求解,得到飞行器的运动状态信息;飞行器控制系统控制制导跟踪目标。本发明提供的方法能够保证系统在预定时间内收敛,同时固定时间干扰观测器模型可以实现对目标所引起的外部扰动的估计,具有较高的命中精度。

    基于强化学习和滑模控制的飞行器碰撞角防御方法和系统

    公开(公告)号:CN119916699A

    公开(公告)日:2025-05-02

    申请号:CN202510423681.0

    申请日:2025-04-07

    Applicant: 南开大学

    Abstract: 本发明涉及飞行器拦截技术领域,提供一种基于强化学习和滑模控制的飞行器碰撞角防御方法和系统。构建来袭飞行器‑目标‑防御飞行器的三体动力学模型;根据所述三体动力学模型构建制导律设计目标;根据所述三体动力学模型和所述制导律设计目标构建防御飞行器滑模制导律;对所述防御飞行器滑模制导律进行深度学习得到防御模型;根据所述防御模型对飞行器进行拦截。本发明中,将深度强化学习与传统滑模控制相结合,引导智能体在前期非盲目性的探索,且在对奖励函数的设计中,添加整型奖励函数,实现强化学习的快速收敛,完成三体对抗中防御飞行器主动防御制导以较高的精度及角度约束实现对来袭飞行器的拦截。

    基于最大熵强化学习算法的模型训练方法及规划制导方法

    公开(公告)号:CN118607613A

    公开(公告)日:2024-09-06

    申请号:CN202411075546.3

    申请日:2024-08-07

    Applicant: 南开大学

    Abstract: 本发明提供一种基于最大熵强化学习算法的模型训练方法及规划制导方法,包括:构建动作评论模型,动作评论模型包括行动网络模块和评论网络模块;动作评论模型根据状态向量得到决策过程向量组,状态向量为从预设环境中得到的;根据决策过程向量组,在最大化熵原则下更新行动网络模块和所述评论网络模块,输出最优策略结果。本发明在最大化熵原则下,避免对整体空间进行计算,大大减少了学习的复杂性。

Patent Agency Ranking