用于机械臂强化学习运动规划的启发式奖励函数设计方法

    公开(公告)号:CN113894787B

    公开(公告)日:2022-06-14

    申请号:CN202111278998.8

    申请日:2021-10-31

    Abstract: 一种用于机械臂强化学习运动规划中启发式奖励函数的设计方法,本发明涉及机器人运动规划与智能控制技术领域。本发明为了解决基于强化学习的机械臂运动规划算法的奖励函数设计无统一的指导方法通常依靠经验进行设计的问题。本发明包括:建立机械臂运动规划问题的启发式函数;根据启发式函数,构建机械臂运动规划的启发式奖励函数;确定启发式奖励函数中的参数取值;利用构建的启发式奖励函数训练机械臂运动规划的神经网络运动规划器。启发式奖励函数明显提升了运动规划的成功率并加快了收敛速度。本发明用于机械臂的运动规划与智能控制领域。

Patent Agency Ranking