一种基于DDPG的移动机器人无先验地图导航决策方法

    公开(公告)号:CN114396949B

    公开(公告)日:2023-11-10

    申请号:CN202210055583.2

    申请日:2022-01-18

    Inventor: 张毅 宋泽 刘想德

    Abstract: 本发明涉及一种基于DDPG的移动机器人无先验地图导航决策方法,属于计算机领域。该方法为:S1:初始化Actor网络、Critic网络的参数、设置经验缓冲池大小以及随机取样的大小;S2:构建导航决策模型的训练的仿真环境;S3:提取机器人搭载的激光雷达(-90°,+90°)范围的9个均匀间隔的扇形区域的测距信息;S4:导航决策模型驱动机器人向目标点靠近,开始对导航决策模型进行训练;S5,重复S4步骤,直到机器人所获得的奖励值和导航成功率保持较高值且保持稳定;S6:导航决策模型训练结束后,设置新的仿真环境对机器人的导航性能和稳定系进行测试验证。本发明具有更快的训练速度、较好的导航性能和泛化性。

    一种基于DDPG的移动机器人无先验地图导航决策方法

    公开(公告)号:CN114396949A

    公开(公告)日:2022-04-26

    申请号:CN202210055583.2

    申请日:2022-01-18

    Inventor: 张毅 宋泽 刘想德

    Abstract: 本发明涉及一种基于DDPG的移动机器人无先验地图导航决策方法,属于计算机领域。该方法为:S1:初始化Actor网络、Critic网络的参数、设置经验缓冲池大小以及随机取样的大小;S2:构建导航决策模型的训练的仿真环境;S3:提取机器人搭载的激光雷达(-90°,+90°)范围的9个均匀间隔的扇形区域的测距信息;S4:导航决策模型驱动机器人向目标点靠近,开始对导航决策模型进行训练;S5,重复S4步骤,直到机器人所获得的奖励值和导航成功率保持较高值且保持稳定;S6:导航决策模型训练结束后,设置新的仿真环境对机器人的导航性能和稳定系进行测试验证。本发明具有更快的训练速度、较好的导航性能和泛化性。

Patent Agency Ranking