一种PID软强化学习航天器姿态控制方法及计算机可读介质

    公开(公告)号:CN116767515A

    公开(公告)日:2023-09-19

    申请号:CN202310707633.5

    申请日:2023-06-14

    Abstract: 本发明提出了一种PID软强化学习航天器姿态控制方法及计算机可读介质。本发明构建改进的SAC算法网络,通过改进的SAC算法网络生成当前时刻航天器的控制动作,将当前时刻航天器姿态的状态数据、当前时刻航天器的控制动作通过龙格库塔数值分析方法计算,得到下一时刻航天器姿态的状态数据;通过改进的奖励函数模型计算得到当前时刻的奖励值;目标网络根据当前时刻航天器姿态的状态数据、当前时刻航天器的控制动作、下一时刻航天器姿态的状态数据以及当前时刻的奖励值,分别更新策略网络、价值网络。本发明缩短SAC算法的学习时间,即使在参数发生变化的情况下,算法依然能够保持较好的控制性能,在实际应用中,航天器可以在较短时间内实现姿态稳定。

    一种遥感卫星对天指向姿态控制方法及计算机可读介质

    公开(公告)号:CN116674767A

    公开(公告)日:2023-09-01

    申请号:CN202310709865.4

    申请日:2023-06-14

    Abstract: 本发明提出了一种遥感卫星对天指向姿态控制方法及计算机可读介质。本发明获取星/地相机配置和先验信息,得到星/地相机的日/地遮蔽角和安装矩阵,根据当前时刻和轨道信息,获取卫星指向地心和太阳的方向矢量;计算卫星对天指向时卫星本体系相对惯性系的期望姿态四元数,并实现卫星对天指向时姿态收敛;结合在轨标定要求及约束,获取推扫角速度、推扫角方向以及推扫时长,并确定旋转欧拉轴,获得卫星对天推扫时的期望姿态四元数和角速度,卫星进行对天推扫。本发明可避免太阳光及地球反射的杂散光对星/地相机同时成像的影响,更适用于线阵地相机推扫成像后遥感图像的处理,满足了遥感卫星星/地相机夹角在轨标定的需求。

    一种TD3软强化学习航天器姿态控制方法及计算机可读介质

    公开(公告)号:CN116788524A

    公开(公告)日:2023-09-22

    申请号:CN202310710449.6

    申请日:2023-06-14

    Abstract: 本发明提出了一种TD3软强化学习航天器姿态控制方法及计算机可读介质。本发明构建改进的TD3‑SAC算法网络,通过改进的TD3‑SAC算法网络生成当前时刻航天器的控制动作,将当前时刻航天器姿态的状态数据、当前时刻航天器的控制动作通过龙格库塔数值分析方法计算,得到下一时刻航天器姿态的状态数据;通过改进的奖励函数模型计算得到当前时刻的奖励值;目标网络根据当前时刻航天器姿态的状态数据、当前时刻航天器的控制动作、下一时刻航天器姿态的状态数据以及当前时刻的奖励值,分别更新策略网络、改进的价值网络。本发明通过共享缓冲区进行学习,在节省了计算资源的同时,也能够实现更高效的学习和更快的收敛速度,从而提升航天器姿态控制性能。

Patent Agency Ranking