基于知识嵌入强化学习的决策方法、装置、设备及介质

    公开(公告)号:CN117115608B

    公开(公告)日:2025-05-23

    申请号:CN202311086572.1

    申请日:2023-08-28

    Abstract: 本发明涉及人工智能技术领域,特别涉及一种基于知识嵌入强化学习的决策方法、装置、设备及介质。方法包括:获取目标环境待决策的原始图像;将所述待决策的原始图像输入至预先训练好的强化学习模型,输出与所述待决策的原始图像相对应的决策;所述预先训练好的强化学习模型包括策略网络、评价网络、回报函数和知识融合模块,所述知识融合模块用于将输入的原始图像与先验知识进行融合,以得到包含先验知识的图向量,所述策略网络用于基于所述图向量向所述目标环境输出决策。本发明,可以得到更加符合预期的决策。

    一种基于锚点的交会对接任务规划方法及装置

    公开(公告)号:CN116972858B

    公开(公告)日:2025-04-08

    申请号:CN202310695250.0

    申请日:2023-06-12

    Abstract: 本发明提供了一种基于锚点的交会对接任务规划方法及装置,涉及交会对接技术领域,其中方法包括:确定主动航天器交会对接飞行轨迹被锚点划分后得到的飞行区间;所述锚点的数量为至少一个;所述锚点为可约束交会对接飞行轨迹且满足设定条件的特征点;基于所述锚点的设定值构建每一个飞行区间的目标要求和约束条件;根据每一个飞行区间的目标要求和约束条件,结合已存在的飞行阶段划分方式和飞行阶段采用的制导律,迭代求解每一个飞行区间的规划方案;基于求解结果输出交会对接任务的规划方案。本方案,能够针对交会对接任务对飞行时间、任务场景的多样性需求,快速输出适配的交会对接任务规划方案。

    面向复杂任务的空间机器人操作方法及装置

    公开(公告)号:CN117508670A

    公开(公告)日:2024-02-06

    申请号:CN202311533613.7

    申请日:2023-11-16

    Abstract: 本发明涉及人工智能技术领域,特别涉及一种面向复杂任务的空间机器人操作方法及装置。方法包括:获取预先训练好的技能库,所述技能库中包括用于完成目标任务的多个子技能;将所述技能库和所述目标任务输入预先训练好的强化学习模型中,得到在不同时刻需要执行的子技能;其中,在不同时刻下,与所述目标任务相关的环境状态不同,每个子技能分别用于执行所述目标任务中的一个子任务,所述强化学习模型是基于所述技能库和预设任务训练得到的;基于各个子技能指导空间机器人依次完成相应子任务的空间操作,直至完成所述目标任务。本发明,可以使机器人准确地完成复杂的空间任务。

    一种多模式交会对接天地平行数字孪生仿真系统

    公开(公告)号:CN117236023A

    公开(公告)日:2023-12-15

    申请号:CN202311212194.7

    申请日:2023-09-19

    Abstract: 本发明提供了一种多模式交会对接天地平行数字孪生仿真系统,通过对在轨航天器的组成部件进行建模得到多个仿真模型,将多个仿真模型连接后得到在轨航天器的数字孪生航天器,利用天地平行异构数据分析子系统获取在轨航天器的在轨飞行数据,以将在轨飞行数据作为初始状态加载至数字孪生航天器的仿真模型中,使得仿真模型能够基于在轨航天器的真实在轨数据进行超实时仿真,从而能够提高仿真结果的准确性,进而利用飞行状态预示子系统基于超实时仿真数据生成未来飞行状态的预示过程,以及利用飞行任务决策子系统根据预示过程判断是否满足交会对接任务的预期,以根据判断结果向在轨航天器输出飞行控制指令,以保障交会对接任务的能够成功实施。

    一种腿臂复用的六轮腿复合移动作业机器人

    公开(公告)号:CN115285250A

    公开(公告)日:2022-11-04

    申请号:CN202210992008.5

    申请日:2022-08-17

    Abstract: 本发明一种腿臂复用的六轮腿复合移动作业机器人,包括本体及六条机械腿,其中:本体上安装用于控制机器人的控制系统以及六条腿的单腿转向电机,六条机械腿结构完全相同,分布在本体的前部、中部和后部,在两前腿末端加装有两个可以实现作业功能的工具。所述的机械腿包括:车轮、车轮驱动电机、小腿连杆、第一膝部铰链、第二膝部铰链、大腿连杆、第一小腿传动连杆、第二小腿传动连杆、小腿传动铰链、小腿驱动电机、大腿驱动电机、腿根支架。本发明所提供的一种腿臂复用的六轮腿复合移动作业机器人具有腿臂复用的功能,同时继承了六轮腿机器人良好的机动性能,可以满足在复杂地形条件下的运动与作业需求。

    一种空间精细操作的离线强化学习方法及系统

    公开(公告)号:CN114819179A

    公开(公告)日:2022-07-29

    申请号:CN202210233709.0

    申请日:2022-03-10

    Abstract: 本发明公开了一种空间精细操作的离线强化学习方法及系统,其中,该方法包括如下步骤:步骤1:采集离线多任务交互数据,并对离线多任务交互数据进行分割;步骤2:基于分割后的离线多任务交互数据,进行离线多任务演员‑评论家优化得到全局策略网络;步骤3:将全局策略网络作为控制器,移植到真实物理环境。本发明实现空间精细操作的交互数据一次离线采集、多种任务多次重复利用,提升样本采集与样本利用效率。

    一种动态增益的在线估计方法

    公开(公告)号:CN112034704A

    公开(公告)日:2020-12-04

    申请号:CN202010732647.9

    申请日:2020-07-27

    Abstract: 本发明一种动态增益的在线估计方法,步骤如下:(1)获取被控对象的动力学模型;(2)建立被控对象的压缩函数,得到被控对象的无误差压缩形式;(3)采用微分器在线求取输出y的导数;(4)在线估计非线性被控对象的状态和输入的系数;(5)计算得到动态增益。本发明通过提出非线性函数的无误差压缩方法和动态增益的在线估计方法,涵盖了多类被控对象,包括航天器被控对象、工业被控对象等,解决了它们基于特征模型的自适应控制问题,突破了动态增益的求解问题,具有通用性。

    一种交会对接平移靠拢段的安全带确定方法

    公开(公告)号:CN107792404B

    公开(公告)日:2019-06-18

    申请号:CN201710855868.3

    申请日:2017-09-20

    Abstract: 本发明提供一种交会对接平移靠拢段的安全带确定方法,所述方法包括:(1)建立平移靠拢段相对位置标称轨迹方程;(2)获取进行交会对接的飞行器之间的相对姿态与相对位置分别对应的测量误差参数;(3)根据相对姿态对应的测量误差参数,获取相对位置对应的飞行偏差信息;(4)根据所述平移靠拢段相对位置标称轨迹方程、相对姿态与相对位置分别对应的测量误差参数、以及相对位置对应的飞行偏差信息,获取相对姿态与相对位置分别对应的不同类别安全带的边界参数;(5)根据相对姿态与相对位置分别对应的不同类别安全带的边界参数,配置相对姿态与相对位置分别对应的不同类别安全带,并且为不同类别安全带分别配置对应的飞行器控制策略。

    一种基于输入平滑的特征模型参数辨识方法

    公开(公告)号:CN105589334B

    公开(公告)日:2018-08-31

    申请号:CN201610103962.9

    申请日:2016-02-26

    Abstract: 一种基于输入平滑的特征模型参数辨识方法,首先获取被控系统对象的特征模型,并根据被控系统对象的输入、输出构建中间变量、未知系数变量,然后使用辨识算法辨识未知系数变量得到辨识值,再对辨识值使用投影算法进行修正,得到修正后的辨识值作为下一周期的未知系数变量,最后根据未知系数变量计算得到中间控制量,进而得到下一周期被控系统对象的输入,完成当前周期的特征参数辨识。本发明方法通过对控制输入进行平滑设计来限制控制量的变化,并进一步限制特征模型参数的变化率,实现了特征模型参数辨识,同时,涵盖了目前常用的2阶特征模型、1阶特征模型,具有较好的通用性与应用前景。

Patent Agency Ranking