一种基于深度强化学习的机械臂渐进式训练方法、存储介质和电子设备

    公开(公告)号:CN118254170A

    公开(公告)日:2024-06-28

    申请号:CN202410338659.1

    申请日:2024-03-22

    Applicant: 河南大学

    Abstract: 本发明公开了一种基于深度强化学习的机械臂渐进式训练方法、存储介质和电子设备,具体包括如下步骤:根据现实场景构建机械臂仿真工作环境,采用无模型算法完成渐进式训练系统的第一阶段训练任务;采用世界模型算法完成渐进式训练系统的第二阶段训练任务;采用训练后的无模型算法和用世界模型算法对机械臂进行具体的任务执行。本发明通过对复杂任务作分解,将工作空间由外向内分为粗操作区与精操作区,对机械臂的训练也据此按先后分为粗训练阶段和精训练阶段,通过结合了非端到端方式和端到端方式,系统中的训练方案在训练时间和训练精度上都优于单独采用无模型算法或世界模型算法,大大提升了机械臂训练效率。

    一种基于深度强化学习的机械臂控制系统校准方法、存储装置和电子设备

    公开(公告)号:CN118123838A

    公开(公告)日:2024-06-04

    申请号:CN202410451582.9

    申请日:2024-04-15

    Applicant: 河南大学

    Abstract: 本发明公开了一种基于深度强化学习的机械臂控制系统校准方法、存储装置和电子设备具体通过定义了系统误差,包括相机位姿误差和机械臂坐标系误差;其次,校准相机位姿误差,从现实系统中获取标物体的多个位姿信息及对应的真实图像,仿真系统中根据上述位姿信息获取相同张数的仿真图像,再利用深度强化学习模型处理上述两组图像,并根据处理结果,指导两套系统相机位姿误差校准。最后,校准机械臂坐标系误差,其校准过程与相机位姿误差的校准类似,但目标物体改为机械臂,位姿调整也由相机改为机械臂。本专利减少了仿真环境与现实环境的差异,使仿真环境中训练的人工智能算法可以直接在现实环境中的机械臂上直接使用,大大降低了算法的迁移难度。

Patent Agency Ranking