-
公开(公告)号:CN117419720A
公开(公告)日:2024-01-19
申请号:CN202311229497.X
申请日:2023-09-22
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供了一种基于分层强化学习进行同步定位与建图的方法,包括:获取分层强化学习模型,其包括定位模块、地图重建模块、全局策略模块、规划器和局部策略模块;持续获取成对观测图,并由所述分层强化学习模型基于强化学习确定控制所述机器人在所处环境运动的控制动作、定位结果和更新所处环境对应的地图,其中,执行当前的控制动作后收集训练数据用于全局策略模块的强化学习,每条训练数据包括一个控制动作对应的全局奖励,所述全局奖励与探索效率和地图精度正相关并在该控制动作导致产生回环信号后对探索效率进行额外奖励。