一种基于深度强化学习的深海采矿机器人路径规划方法
Abstract:
本发明属于深海采矿机器人的路径规划领域,具体说是一种基于深度强化学习的深海采矿机器人路径规划方法,具体为:构建采矿机器人运动学模型;设计路径规划系统的状态输入;将采矿机器人的动作进行离散化处理,使用贪婪策略的方法进行动作选取;构建路径规划系统,将网络设置成对偶结构,搭建神经网络结构框架;构建记忆库存储交互数据,抽取经验进行学习,使用优先级经验回放技术,增加样本效率;基于任务需求及采矿机器人运动形式,将任务目标分解,设计奖励函数,引导采矿机器人完成路径规划任务,优化行驶路径;搭建虚拟仿真环境,进行训练直至获得最优策略,保存训练好的神经网络参数,将其用于真实环境中,输出规划策略,完成路径规划。
Patent Agency Ranking
0/0