人群感知机器人的多目标强化学习导航方法

    公开(公告)号:CN116384477A

    公开(公告)日:2023-07-04

    申请号:CN202310185203.1

    申请日:2023-03-01

    Abstract: 本发明公开人群感知机器人的多目标强化学习导航方法。首先,初始化多目标强化学习参数。然后,采集得到当前环境下智能体的状态信息,并对数据进行相应的预处理。其次,将处理好的智能体的状态信息送入到价值网络输出智能体的决策动作,根据不同的目标奖励函数计算累计奖励对智能体进行评价,利用多目标强化学习算法进行价值网络参数更新。最后,判断是否到达最大训练次数,通过不断地试错学习得到良好的导航表现。本发明提出一种端到端的机器人导航框架,实现针对动态权重下多个目标间的权衡,提高了机器人在密集人群场所中的导航性能表现。

Patent Agency Ranking