一种基于深度强化学习的仓储系统多机器人路径规划方法

    公开(公告)号:CN113110509B

    公开(公告)日:2023-02-28

    申请号:CN202110535242.0

    申请日:2021-05-17

    Abstract: 本发明提供了一种基于深度强化学习的仓储系统多机器人路径规划方法,包括如下步骤:步骤S1:定义多机器人路径规划问题中的节点、状态、动作、奖励回报;步骤S2:选择子目标点,中央控制器计算每个机器人的状态;步骤S3:基于深度强化学习方法,设计分布式多机器人路径规划器;步骤S4:计算损失函数,对网络参数进行更新;步骤S5:将训练好的模型应用于多机器人路径规划。本发明的有益效果是:本发明能够解决传统路径规划算法实时性差的问题,并且容易拓展到不同地图规模、不同机器人数量的仓储系统中,具有良好的泛化性能。

    一种基于深度强化学习的仓储系统多机器人路径规划方法

    公开(公告)号:CN113110509A

    公开(公告)日:2021-07-13

    申请号:CN202110535242.0

    申请日:2021-05-17

    Abstract: 本发明提供了一种基于深度强化学习的仓储系统多机器人路径规划方法,包括如下步骤:步骤S1:定义多机器人路径规划问题中的节点、状态、动作、奖励回报;步骤S2:选择子目标点,中央控制器计算每个机器人的状态;步骤S3:基于深度强化学习方法,设计分布式多机器人路径规划器;步骤S4:计算损失函数,对网络参数进行更新;步骤S5:将训练好的模型应用于多机器人路径规划。本发明的有益效果是:本发明能够解决传统路径规划算法实时性差的问题,并且容易拓展到不同地图规模、不同机器人数量的仓储系统中,具有良好的泛化性能。

Patent Agency Ranking