-
公开(公告)号:CN118404582A
公开(公告)日:2024-07-30
申请号:CN202410614847.2
申请日:2024-05-17
Applicant: 重庆大学
IPC: B25J9/16
Abstract: 本发明提出了一种基于强化学习的灵巧臂手机器人复杂技能学习方法,通过Isaac Gym平台构建仿真环境,利用单一的神经网络实现多任务训练,并通过统一奖励模型来适应不同的操作技能。在技能学习过程中,采用关键点标定物体和目标位置,简化了成功标准的判定,提升了学习效率。同时,建立分阶段性的奖励函数公式,有效避免了潜在的局部最小值问题,使学习过程更加稳定可靠。此外,还引入了指尖接触奖励机制,促进了精确的指尖与物体交互,进一步提升了操作技能的精确性。最后,结合域随机化技术,增强了机器人在不同环境下的适应性和鲁棒性,使其能够应对更为复杂的操作任务。
-
-
公开(公告)号:CN118410705B
公开(公告)日:2025-01-24
申请号:CN202410493736.0
申请日:2024-04-23
Applicant: 重庆大学
IPC: G06F30/27 , G06F30/10 , G06N3/092 , G06N3/0464 , G06N3/045 , G06N3/0475 , G06N3/094 , G06F17/10
Abstract: 本发明公开了一种基于残差分层强化学习的臂‑手机器人技能学习方法,旨在解决灵巧臂‑手机器人强化学习训练速度慢、任务成功率低的问题,涉及灵巧臂‑手机器人智能控制技术领域。该方法包括在物理仿真引擎MuJoCo中搭建用于训练灵巧臂‑手机器人完成开门任务和螺孔装配任务的场景;通过视觉遥操作构建多功能基元库并搭建示教模仿学习网络;搭建基于残差的分层强化学习框架;执行HRL‑GAIL强化学习训练,能够明显提升灵巧臂‑手机器人的技能学习速度、规范性以及泛化能力。
-
公开(公告)号:CN118410705A
公开(公告)日:2024-07-30
申请号:CN202410493736.0
申请日:2024-04-23
Applicant: 重庆大学
IPC: G06F30/27 , G06F30/10 , G06N3/092 , G06N3/0464 , G06N3/045 , G06N3/0475 , G06N3/094 , G06F17/10
Abstract: 本发明公开了一种基于残差分层强化学习的臂‑手机器人技能学习方法,旨在解决灵巧臂‑手机器人强化学习训练速度慢、任务成功率低的问题,涉及灵巧臂‑手机器人智能控制技术领域。该方法包括在物理仿真引擎MuJoCo中搭建用于训练灵巧臂‑手机器人完成开门任务和螺孔装配任务的场景;通过视觉遥操作构建多功能基元库并搭建示教模仿学习网络;搭建基于残差的分层强化学习框架;执行HRL‑GAIL强化学习训练,能够明显提升灵巧臂‑手机器人的技能学习速度、规范性以及泛化能力。
-
-
-