-
公开(公告)号:CN119589681A
公开(公告)日:2025-03-11
申请号:CN202411975691.7
申请日:2024-12-30
Applicant: 中国科学院自动化研究所
IPC: B25J9/16
Abstract: 本公开涉及一种基于模仿学习的机器人技能持续学习方法和装置,所述方法包括:依次针对多个任务中的每个任务,在满足预设终止条件之前循环执行以下操作:将观测图像、状态信息、预先获取的当前任务的文本指令、以及当前任务的技能编码本输入到模仿学习策略网络,预测得到当前时刻机器人的动作信息,其中,当前任务的技能编码本是预先初始化的多个可学习的子技能向量,在具有先前任务的情况下,包含先前任务的技能编码本的技能信息;基于预测得到的机器人的动作信息和专家演示数据中机器人的真实动作信息计算损失;基于损失对模仿学习策略网络和当前任务的技能编码本进行更新。解决了技能选择不灵活、人为设计技能难以抽象子技能层次结构等问题。