-
公开(公告)号:CN110084307B
公开(公告)日:2021-06-18
申请号:CN201910361528.4
申请日:2019-04-30
Applicant: 东北大学
Abstract: 本发明提出了一种基于深度强化学习的移动机器人视觉跟随方法。采用“模拟图像有监督预训练+模型迁移+RL”的架构,首先在真实环境中收集少量的数据,采用计算机程序和图像处理技术对数据集进行自动化扩充,以便在短时间内得到大量可以适应真实场景的模拟数据集,用于对跟随机器人的方向控制模型进行有监督训练;其次,搭建用于机器人方向控制的CNN模型,并用自动化构造的模拟数据集对其进行有监督训练,使其作为预训练模型;接着将预训练模型的知识迁移到基于DRL的控制模型中,令机器人在真实环境中执行跟随任务,结合强化学习机制,使得机器人可以在环境交互的过程中一边跟随,一边对方向控制性能进行提升,不仅鲁棒性高,且大大降低成本。
-
公开(公告)号:CN110084307A
公开(公告)日:2019-08-02
申请号:CN201910361528.4
申请日:2019-04-30
Applicant: 东北大学
Abstract: 本发明提出了一种基于深度强化学习的移动机器人视觉跟随方法。采用“模拟图像有监督预训练+模型迁移+RL”的架构,首先在真实环境中收集少量的数据,采用计算机程序和图像处理技术对数据集进行自动化扩充,以便在短时间内得到大量可以适应真实场景的模拟数据集,用于对跟随机器人的方向控制模型进行有监督训练;其次,搭建用于机器人方向控制的CNN模型,并用自动化构造的模拟数据集对其进行有监督训练,使其作为预训练模型;接着将预训练模型的知识迁移到基于DRL的控制模型中,令机器人在真实环境中执行跟随任务,结合强化学习机制,使得机器人可以在环境交互的过程中一边跟随,一边对方向控制性能进行提升,不仅鲁棒性高,且大大降低成本。
-