一种室内移动机器人强化学习导航方法

    公开(公告)号:CN116088495A

    公开(公告)日:2023-05-09

    申请号:CN202211416730.0

    申请日:2022-11-14

    Applicant: 中北大学

    Abstract: 本发明属于强化学习领域,具体涉及一种室内移动机器人强化学习导航方法,为解决在复杂环境复杂奖励的情况下,智能体导航中的样本利用率低以及导航成功率不高的问题,本发明在D3QN算法基础上,引入优势后见经验回放算法和分层强化学习结构。首先,通过比较不同轨迹点的优势函数来选择新目标点,拥有最大优势函数的轨迹点作为新目标点,根据新目标点,对轨迹样本重新标记并存入经验池中。然后,在分层强化学习的结构下,训练智能体在复杂的环境下学习,顶层智能体负责学习大范围的路径规划,底层智能体负责导航到子目标,最后实现到总目标点的导航。

    一种基于双网络的多智能体强化学习导航描述方法

    公开(公告)号:CN118010052A

    公开(公告)日:2024-05-10

    申请号:CN202410135838.5

    申请日:2024-01-31

    Applicant: 中北大学

    Abstract: 本发明公开了一种基于双网络的多智能体强化学习导航描述方法,属于智能控制技术领域。针对如何提高智能体探索能力和自主性的问题和解决基于值函数的强化学习算法值估计不准确的问题,通过双Actor网络增强智能体探索能力,再通过双Critic网络将两个Q值线性组合使Q值更接近真实值,有效缓解了值估计不准确的问题,使算法更加稳定和健壮,显著提高了导航的成功率。

Patent Agency Ranking