一种基于隐状态和强化学习的行星际轨道转移方法

    公开(公告)号:CN119861572A

    公开(公告)日:2025-04-22

    申请号:CN202510340687.1

    申请日:2025-03-21

    Abstract: 本发明公开了一种基于隐状态和强化学习的行星际轨道转移方法,涉及航天器控制技术领域。本发明通过建立序列隐变量模型,可以显式地对不确定环境进行表示学习,提取隐藏在不确定环境观测下的隐藏信息。并通过演员网络和评论家网络组成强化学习控制器。采用序列隐变量模型和强化学习控制器构建强化学习算法框架,从而加快智能体在不确定环境中的训练,提高智能体对不确定性的处理能力。此外,本发明实施例还将基于当前观测和预期操作预测下一状态,并将预测的下一状态的质量纳入奖励结构中,使得即时奖励能够同时捕获当前和后续策略的有效性,进而提高算法的学习效率。

    一种基于强化学习的航天器集群分布式容错控制方法

    公开(公告)号:CN118884845B

    公开(公告)日:2025-01-24

    申请号:CN202411395285.3

    申请日:2024-10-08

    Abstract: 本发明公开了一种基于强化学习的航天器集群分布式容错控制方法,涉及航天器控制技术领域。通过固定时间分布式估计器,保证集群内跟随者能在固定时间内获得领航者的位置与速度信息。并通过固定时间分布式估计器和反步控制方法设计近似最优虚拟控制量与近似可用控制量。在此基础上,引入径向基函数与参与者—评价者网络来处理近似最优虚拟控制量与近似可用控制量中的未知非线性项与哈密顿—雅可比—贝尔曼方程。最后通过执行机构故障处理环节优化近似可用控制量,保证航天器集群能在执行机构故障的影响下完成预定编队任务。

    一种基于神经网络在线学习的飞行器快速机动方法

    公开(公告)号:CN118963152A

    公开(公告)日:2024-11-15

    申请号:CN202411448434.8

    申请日:2024-10-17

    Abstract: 本发明公开了一种基于神经网络在线学习的飞行器快速机动方法,涉及高超音速飞行器控制技术领域。通过基于历史数据在线学习的神经网络处理未知的系统不确定性,并通过固定时间滤波器来估计虚拟控制的导数和一些必要的信息。基于神经网络估计的信息和固定时间反步控制器,解决了高超音速飞行器的固定时间跟踪问题。由于神经网络具有自学习功能和并行计算能力,可以快速得到最优的控制效果,因此本发明的固定时间反步控制器可以确保具有不确定性的高超音速飞行器控制系统在固定时间内使系统姿态和速度稳定到期望状态。

Patent Agency Ranking