-
公开(公告)号:CN117540203A
公开(公告)日:2024-02-09
申请号:CN202311374713.X
申请日:2023-10-23
Applicant: 北京科技大学
IPC: G06F18/214 , G06F18/2413 , G06N3/126 , G06N3/008
Abstract: 本发明涉及机器人导航技术领域,特别是指一种集群机器人合作导航的多向课程学习训练方法及装置。一种集群机器人合作导航的多向课程学习训练方法包括:使用训练任务进行训练,获得集群机器人性能表现;根据训练任务,通过多向交叉算子以及多向变异算子,获得阶段任务;根据集群机器人性能表现,使用原型评估方法对阶段任务进行评估,获得集群机器人适应度;根据集群机器人适应度以及阶段任务,获得新训练任务;对多智能体进行强化学习训练;通过训练完成集群机器人进行导航。本发明是一种基于多向课程强化学习高效、稳定的集群机器人合作导航方法。
-
公开(公告)号:CN117540203B
公开(公告)日:2024-10-25
申请号:CN202311374713.X
申请日:2023-10-23
Applicant: 北京科技大学
IPC: G06F18/214 , G06F18/2413 , G06N3/126 , G06N3/008
Abstract: 本发明涉及机器人导航技术领域,特别是指一种集群机器人合作导航的多向课程学习训练方法及装置。一种集群机器人合作导航的多向课程学习训练方法包括:使用训练任务进行训练,获得集群机器人性能表现;根据训练任务,通过多向交叉算子以及多向变异算子,获得阶段任务;根据集群机器人性能表现,使用原型评估方法对阶段任务进行评估,获得集群机器人适应度;根据集群机器人适应度以及阶段任务,获得新训练任务;对多智能体进行强化学习训练;通过训练完成集群机器人进行导航。本发明是一种基于多向课程强化学习高效、稳定的集群机器人合作导航方法。
-
公开(公告)号:CN116523076A
公开(公告)日:2023-08-01
申请号:CN202310749552.1
申请日:2023-06-25
Applicant: 北京科技大学
IPC: G06N20/00
Abstract: 本发明涉及多智能体控制技术领域,特别是指一种用于多智能体决策的多向课程强化学习方法及装置。一种用于多智能体决策的多向课程强化学习方法包括:使用训练任务,对多智能体进行训练,获得多智能体性能表现;根据训练任务,通过多向交叉算子以及多向变异算子,获得阶段任务;根据多智能体性能表现,使用原型评估方法对阶段任务进行评估,获得多智能体适应度;根据多智能体适应度以及阶段任务,获得新训练任务;根据多智体性能表现以及预设阈值进行比对,当多智体性能表现大于或等于预设成功率阈值时,对多智能体进行强化学习训练。本发明是一种用于多智能体决策的高效、稳定的多向课程强化学习训练方法。
-
-