一种集群机器人合作导航的多向课程学习训练方法及装置

    公开(公告)号:CN117540203A

    公开(公告)日:2024-02-09

    申请号:CN202311374713.X

    申请日:2023-10-23

    Inventor: 马惠敏 张可鹏

    Abstract: 本发明涉及机器人导航技术领域,特别是指一种集群机器人合作导航的多向课程学习训练方法及装置。一种集群机器人合作导航的多向课程学习训练方法包括:使用训练任务进行训练,获得集群机器人性能表现;根据训练任务,通过多向交叉算子以及多向变异算子,获得阶段任务;根据集群机器人性能表现,使用原型评估方法对阶段任务进行评估,获得集群机器人适应度;根据集群机器人适应度以及阶段任务,获得新训练任务;对多智能体进行强化学习训练;通过训练完成集群机器人进行导航。本发明是一种基于多向课程强化学习高效、稳定的集群机器人合作导航方法。

    一种集群机器人合作导航的多向课程学习训练方法及装置

    公开(公告)号:CN117540203B

    公开(公告)日:2024-10-25

    申请号:CN202311374713.X

    申请日:2023-10-23

    Inventor: 马惠敏 张可鹏

    Abstract: 本发明涉及机器人导航技术领域,特别是指一种集群机器人合作导航的多向课程学习训练方法及装置。一种集群机器人合作导航的多向课程学习训练方法包括:使用训练任务进行训练,获得集群机器人性能表现;根据训练任务,通过多向交叉算子以及多向变异算子,获得阶段任务;根据集群机器人性能表现,使用原型评估方法对阶段任务进行评估,获得集群机器人适应度;根据集群机器人适应度以及阶段任务,获得新训练任务;对多智能体进行强化学习训练;通过训练完成集群机器人进行导航。本发明是一种基于多向课程强化学习高效、稳定的集群机器人合作导航方法。

    一种用于多智能体决策的多向课程强化学习方法及装置

    公开(公告)号:CN116523076A

    公开(公告)日:2023-08-01

    申请号:CN202310749552.1

    申请日:2023-06-25

    Inventor: 马惠敏 张可鹏

    Abstract: 本发明涉及多智能体控制技术领域,特别是指一种用于多智能体决策的多向课程强化学习方法及装置。一种用于多智能体决策的多向课程强化学习方法包括:使用训练任务,对多智能体进行训练,获得多智能体性能表现;根据训练任务,通过多向交叉算子以及多向变异算子,获得阶段任务;根据多智能体性能表现,使用原型评估方法对阶段任务进行评估,获得多智能体适应度;根据多智能体适应度以及阶段任务,获得新训练任务;根据多智体性能表现以及预设阈值进行比对,当多智体性能表现大于或等于预设成功率阈值时,对多智能体进行强化学习训练。本发明是一种用于多智能体决策的高效、稳定的多向课程强化学习训练方法。

Patent Agency Ranking