-
公开(公告)号:CN119839874A
公开(公告)日:2025-04-18
申请号:CN202510315668.3
申请日:2025-03-18
Applicant: 华东交通大学
IPC: B25J9/16
Abstract: 本发明公开了一种机器人运动控制方法及系统,方法包括:获取机器人运动前的环境信息,并根据所述环境信息,采用轨迹规划算法规划出所述机器人的最优轨迹;根据所述最优轨迹构建轨迹模仿奖励函数,并将所述轨迹模仿奖励函数加入至自适应动态奖励函数,得到目标自适应动态奖励函数;基于所述目标自适应动态奖励函数控制所述机器人对所述最优轨迹进行模仿;根据改进裁剪机制的PPO深度强化学习算法对所述机器人的运动轨迹进行训练和学习,最终得到所述机器人的最优控制策略。自适应动态奖励机制能够根据环境状况动态调整奖励权重,而参考轨迹奖励则提供了方向性指引,这种组合在保持轨迹精确性的同时,能灵活地应对环境的实时变化。