基于强化学习全状态约束控制机械臂轨迹方法及系统

    公开(公告)号:CN119897848A

    公开(公告)日:2025-04-29

    申请号:CN202411881233.7

    申请日:2024-12-19

    Applicant: 安徽大学

    Abstract: 本发明提供基于强化学习全状态约束控制机械臂轨迹方法及系统,方法包括:建立n自由度旋转关节的刚性机械臂动力学模型;根据动力学模型、状态约束,设计误差转换函数,将有约束的误差e转换为无约束的误差ξ;根据无约束误差ξ的更新率,设计机械臂系统的成本函数;通过成本函数,构建雅可比‑贝尔曼‑哈密顿方程,求解得到最优控制器;利用critic神经网络近似逼近最优成本函数,得到近似最优控制器;根据近似最优控制器,推出近似哈密顿‑雅可比‑贝尔曼方程,与原哈密顿‑雅可比‑贝尔曼做差,梯度下降获得critic网络权值矩阵更新率。本发明解决了不确定性及动态变化场景下、多约束条件下,存在的难以实现机械臂轨迹跟踪、机械臂轨迹跟踪精度较低的技术问题。

Patent Agency Ranking