基于关键点和模仿学习的动作预测方法、终端及存储介质

    公开(公告)号:CN119648747A

    公开(公告)日:2025-03-18

    申请号:CN202510162679.2

    申请日:2025-02-14

    Abstract: 本发明公开了基于关键点和模仿学习的动作预测方法、终端及存储介质,涉及具身智能技术领域。本发明将世界模型的思想与模仿学习结合,通过环境动力学预测模型学习到更符合环境上下文的场景表示,并通过训练后的轨迹预测模型预测关键点运动轨迹,以辅助动作头模块进行动作决策。本发明利用关键点运动轨迹作为辅助信息,可以有效提升智能体的决策准确性。首先关键点不会受到光照等环境变化的影响,即使物体被部分遮挡,剩余部分的关键点轨迹依然能够提供同样的信息,因此具有较好的鲁棒性。其次,关键点的运动轨迹与智能机械装置在三维空间中的运动轨迹存在确定的映射关系,因此能够使得神经网络更好的拟合智能机械装置的移动动作。

    一种基于改进Dreamer框架的机械臂抓取方法

    公开(公告)号:CN117464676A

    公开(公告)日:2024-01-30

    申请号:CN202311488524.5

    申请日:2023-11-09

    Abstract: 本发明公开了一种基于改进Dreamer框架的机械臂抓取方法,涉及智能生产制造领域,本发明首先通过对机械臂建模和观测动作空间及奖励函数设计构建自主决策强化学习问题模型。其次,搭建了一个具有一套基本控制接口的机械臂操作仿真平台,可与各种强化学习算法相结合。然后,通过所提出的带有前向预测的世界模型有效对生产环境进行模拟和预测,令世界模型同时学习向前与向后两种环境动力学,提高了交互得到的训练数据利用率。最后,将改进的世界模型嵌入深度强化学习算法Dreamer框架中,在搭建的平台上在线交互训练机械臂自主抓放,最终在训练的收敛速度、样本效率以及表现性能等方面均表现良好,对现实中实现智能制造中机械臂自主决策环节有重要意义。

Patent Agency Ranking