一种基于目标驱动的强化学习导航方法

    公开(公告)号:CN117475279A

    公开(公告)日:2024-01-30

    申请号:CN202311434559.0

    申请日:2023-10-31

    Abstract: 本发明涉及计算机视觉导航技术领域,具体涉及一种基于目标驱动的强化学习导航方法。本发明利用基于Transformer网络的DETR算法更有效地提取视觉图像中的目标信息,效率更高,泛化性更强;所设计的智能体状态特征提取方法,使得强化学习决策网络能获得全面丰富的状态信息以促进网络学习;其中深度强化学习决策网络中将启发式控制器引入到基线PPO算法中,能够帮助强化学习训练更快收敛,避免陷入局部最优甚至不收敛,提升算法的整体效率。本发明的方法能够在没有环境先验信息的条件下进行自主导航,具有一定的泛化性和可迁移性。

    一种基于视觉输入的无人平台强化学习自主导航系统及方法

    公开(公告)号:CN116734850A

    公开(公告)日:2023-09-12

    申请号:CN202310458355.4

    申请日:2023-04-26

    Abstract: 本发明属于无人平台自主导航技术领域,特别涉及一种基于视觉输入的无人平台强化学习自主导航系统及方法。本发明设计了一套完整的,基于视觉输入的,从环境数据获取、环境特征提取到路径规划算法实现的无人平台自主导航系统,本发明设计独特的运动状态特征提取网络和视觉特征提取网络,使得强化学习决策网络能获得全面丰富的状态信息以促进网络学习;同时,本发明设计的基于动作调整的强化学习导航算法将启发式控制器与动作调整网络共同引入到基线PPO算法中,能够帮助强化学习训练更快收敛,避免陷入局部最优甚至不收敛,提升算法的整体效率;总体来看,本发明所提出的导航系统能够在没有环境先验信息的条件下进行自主导航,具有泛化性和可迁移性。

Patent Agency Ranking