Patent search ap:("北京科技大学") AND inv:"张可鹏" Page 1

1.

发明公开
一种集群机器人合作导航的多向课程学习训练方法及装置有权

公开(公告)号：CN117540203A

公开(公告)日：2024-02-09

申请号：CN202311374713.X

申请日：2023-10-23

Applicant: 北京科技大学

Inventor： 马惠敏 , 张可鹏

IPC: G06F18/214 , G06F18/2413 , G06N3/126 , G06N3/008

Abstract: 本发明涉及机器人导航技术领域，特别是指一种集群机器人合作导航的多向课程学习训练方法及装置。一种集群机器人合作导航的多向课程学习训练方法包括：使用训练任务进行训练，获得集群机器人性能表现；根据训练任务，通过多向交叉算子以及多向变异算子，获得阶段任务；根据集群机器人性能表现，使用原型评估方法对阶段任务进行评估，获得集群机器人适应度；根据集群机器人适应度以及阶段任务，获得新训练任务；对多智能体进行强化学习训练；通过训练完成集群机器人进行导航。本发明是一种基于多向课程强化学习高效、稳定的集群机器人合作导航方法。

2.

发明授权
一种集群机器人合作导航的多向课程学习训练方法及装置有权

公开(公告)号：CN117540203B

公开(公告)日：2024-10-25

申请号：CN202311374713.X

申请日：2023-10-23

Applicant: 北京科技大学

Inventor： 马惠敏 , 张可鹏

IPC: G06F18/214 , G06F18/2413 , G06N3/126 , G06N3/008

Abstract: 本发明涉及机器人导航技术领域，特别是指一种集群机器人合作导航的多向课程学习训练方法及装置。一种集群机器人合作导航的多向课程学习训练方法包括：使用训练任务进行训练，获得集群机器人性能表现；根据训练任务，通过多向交叉算子以及多向变异算子，获得阶段任务；根据集群机器人性能表现，使用原型评估方法对阶段任务进行评估，获得集群机器人适应度；根据集群机器人适应度以及阶段任务，获得新训练任务；对多智能体进行强化学习训练；通过训练完成集群机器人进行导航。本发明是一种基于多向课程强化学习高效、稳定的集群机器人合作导航方法。

3.

发明公开
一种用于多智能体决策的多向课程强化学习方法及装置无效

公开(公告)号：CN116523076A

公开(公告)日：2023-08-01

申请号：CN202310749552.1

申请日：2023-06-25

Applicant: 北京科技大学

Inventor： 马惠敏 , 张可鹏

IPC: G06N20/00

Abstract: 本发明涉及多智能体控制技术领域，特别是指一种用于多智能体决策的多向课程强化学习方法及装置。一种用于多智能体决策的多向课程强化学习方法包括：使用训练任务，对多智能体进行训练，获得多智能体性能表现；根据训练任务，通过多向交叉算子以及多向变异算子，获得阶段任务；根据多智能体性能表现，使用原型评估方法对阶段任务进行评估，获得多智能体适应度；根据多智能体适应度以及阶段任务，获得新训练任务；根据多智体性能表现以及预设阈值进行比对，当多智体性能表现大于或等于预设成功率阈值时，对多智能体进行强化学习训练。本发明是一种用于多智能体决策的高效、稳定的多向课程强化学习训练方法。

Patent Agency Ranking