-
公开(公告)号:CN115585813A
公开(公告)日:2023-01-10
申请号:CN202211397557.4
申请日:2022-11-09
Applicant: 东北大学
Abstract: 本发明公开一种基于注意力机制的深度强化学习机器人导航方法包括:采集机器人车载摄像头信息、车载单线激光雷达信息以及机器人的线速度和角速度;摄像头信息和单线激光雷达信息数据融合;构建SAC深度强化学习算法的经验池,用于存储动作‑状态‑奖励的组合;构建SAC深度强化学习算法的Actor网络、V评论家网络、Q评论家网络;在Actor网络中构建空间注意力模块和时间注意力模块;构建奖励函数模型。其中Actor网络的输入为状态,输出为动作概率分布参数;V评论家网络的输出为状态价值的预测值;Q评论家网络的输出为动作‑状态价值的预测值。本发明的导航方法不需要先验地图信息,以及导航环境的限制,适用性广、可扩展性强。