火星探测器动力下降段的对抗式逆强化学习着陆方法

    公开(公告)号:CN117474076A

    公开(公告)日:2024-01-30

    申请号:CN202311172503.2

    申请日:2023-09-12

    Abstract: 本发明涉及一种火星探测器动力下降段的对抗式逆强化学习着陆方法。其中的方法包括:获取火星探测器的当前状态,以及初始化对抗式逆强化学习网络模型的网络参数,模型设置有策略网络和判别网络,采用专家数据库进行训练,根据当前状态,通过策略网络生成一系列的状态动作对轨迹,通过判别网络计算状态动作对轨迹的奖励值,以生成新的最优动作轨迹,将最优动作轨迹作为控制命令输出,并从最优动作轨迹中采样数据以更新策略网络的网络参数。本发明通过对抗式逆强化学习算法完成火星探测器着陆时动力下降段的着陆任务,通过设计策略网络、判别网络及网络训练各项参数,使得控制器能够满足执行机构故障、引力场未知状况下的着陆要求。

Patent Agency Ranking