一种机器人轮椅类人交互操作技能学习方法及系统

    公开(公告)号:CN116430988A

    公开(公告)日:2023-07-14

    申请号:CN202310153471.5

    申请日:2023-02-23

    Abstract: 本发明公开了一种机器人轮椅类人交互操作技能学习方法及系统,方法包括:获取多条人机交互技能演示数据,采用基于贝塔过程的自回归隐马尔可夫模型对人机交互技能演示数据进行分割,得到分割后的多个分段人机交互技能演示数据;采用动态时间规整方法对分段人机交互技能演示数据进行时间对齐;根据对齐后的人机交互技能演示数据,采用高斯混合模型与高斯混合回归学习得到平均的类人交互操作技能轨迹;根据平均的类人交互操作技能轨迹,利用动态运动基元模型进行再学习,获得最终学习的类人交互操作技能;采用高斯过程回归方法学习轮椅行驶轨迹与类人交互操作技能的映射关系,实现类人交互操作技能对轮椅行驶轨迹的调用。

    基于分层强化学习的机械臂复杂操作技能学习方法及系统

    公开(公告)号:CN116079737A

    公开(公告)日:2023-05-09

    申请号:CN202310153474.9

    申请日:2023-02-23

    Abstract: 本发明公开了一种基于分层强化学习的机械臂复杂操作技能学习方法及系统,方法包括:获取复杂任务数据,将复杂任务分解为多个子任务;确定每个子任务的RL参数;根据每个子任务的RL参数,构建底层训练网络结构,训练每个子任务,得到子任务最优策略集合;当有新的复杂任务执行时,根据所有子任务的RL参数确定新任务的RL参数;根据新任务的RL参数和子任务最优策略集合,构建上层训练网络结构,训练得到子任务选择策略;根据子任务选择策略,通过子任务重构得到新任务的最优策略,实现新任务的再现与泛化。

    基于生成对抗模仿学习的机械臂复杂操作技能学习方法及系统

    公开(公告)号:CN117733841A

    公开(公告)日:2024-03-22

    申请号:CN202311665423.0

    申请日:2023-12-06

    Abstract: 本发明公开了一种基于生成对抗模仿学习的机械臂复杂操作技能学习方法及系统,方法包括:获取复杂任务数据,将复杂任务的轨迹分割为多个子任务轨迹;针对每个子任务轨迹,确定每个子任务的强化学习RL参数,获取对应子任务的专家策略,形成子任务专家策略集合;基于所述子任务专家策略集合,使用生成对抗模仿学习GAIL算法进行预训练,得到子任务策略集合;其中所述子任务策略集合包括子任务专家策略和子任务生成策略以及对应的奖励函数;基于子任务策略集合,通过领域随机化的方法,使用SAC算法进行正式训练,得到子任务的最优策略集合。通过GAIL预训练使底层子任务不再从零开始学习,只需要有限的样本数量就可以引导策略学习。

Patent Agency Ranking