-
公开(公告)号:CN116384477A
公开(公告)日:2023-07-04
申请号:CN202310185203.1
申请日:2023-03-01
IPC: G06N3/092
Abstract: 本发明公开人群感知机器人的多目标强化学习导航方法。首先,初始化多目标强化学习参数。然后,采集得到当前环境下智能体的状态信息,并对数据进行相应的预处理。其次,将处理好的智能体的状态信息送入到价值网络输出智能体的决策动作,根据不同的目标奖励函数计算累计奖励对智能体进行评价,利用多目标强化学习算法进行价值网络参数更新。最后,判断是否到达最大训练次数,通过不断地试错学习得到良好的导航表现。本发明提出一种端到端的机器人导航框架,实现针对动态权重下多个目标间的权衡,提高了机器人在密集人群场所中的导航性能表现。
-
公开(公告)号:CN112484733A
公开(公告)日:2021-03-12
申请号:CN202011402063.1
申请日:2020-12-04
Applicant: 东南大学
Abstract: 本发明涉及一种基于拓扑图的强化学习室内导航方法,针对强化学习在导航任务中数据效率低,算法泛化性能差等问题,本发明结合了传统路径规划方法以及强化学习算法。通过对智能体的相对位置进行估计,进而依据关键位置对场景建立抽象的稀疏拓扑图,根据结点之间实际的物理距离定义连接关系,通过将传统路径规划算法与强化学习相结合的方式,形成了一种分层的导航策略,将长距离的导航问题分解为短期目标的导航问题,提升了在室内场景下的导航算法的学习效率以及泛化性能。
-
公开(公告)号:CN112484733B
公开(公告)日:2022-10-25
申请号:CN202011402063.1
申请日:2020-12-04
Applicant: 东南大学
Abstract: 本发明涉及一种基于拓扑图的强化学习室内导航方法,针对强化学习在导航任务中数据效率低,算法泛化性能差等问题,本发明结合了传统路径规划方法以及强化学习算法。通过对智能体的相对位置进行估计,进而依据关键位置对场景建立抽象的稀疏拓扑图,根据结点之间实际的物理距离定义连接关系,通过将传统路径规划算法与强化学习相结合的方式,形成了一种分层的导航策略,将长距离的导航问题分解为短期目标的导航问题,提升了在室内场景下的导航算法的学习效率以及泛化性能。
-
-