一种适用于复杂未知环境的自适应SAC-PID方法

    公开(公告)号:CN113359704B

    公开(公告)日:2022-04-19

    申请号:CN202110525617.5

    申请日:2021-05-13

    Abstract: 一种适用于复杂未知环境的自适应SAC‑PID方法,实现了无模型的PID参数的自适应最优整定。包含如下步骤:首先,获取表征移动机器人当前状态特征的信息;其次,基于深度强化学习SoftActor‑Critic算法,将状态信息输入强化学习网络模型,得到PID控制器的参数,PID控制器输出角速度信息控制移动机器人循迹;最后,根据设计好的奖励函数计算此次动作的奖励,并得到下一个时刻的状态,在与环境的交互中不断优化强化学习网络模型,得到最优的策略网络。该方法克服了传统PID控制自适应调参中对模型和经验的依赖,在仿真和落地的实验中均取得了优异的效果,并且具备良好的泛化性和鲁棒性。

    一种适用于复杂未知环境的自适应SAC-PID方法

    公开(公告)号:CN113359704A

    公开(公告)日:2021-09-07

    申请号:CN202110525617.5

    申请日:2021-05-13

    Abstract: 一种适用于复杂未知环境的自适应SAC‑PID方法,实现了无模型的PID参数的自适应最优整定。包含如下步骤:首先,获取表征移动机器人当前状态特征的信息;其次,基于深度强化学习SoftActor‑Critic算法,将状态信息输入强化学习网络模型,得到PID控制器的参数,PID控制器输出角速度信息控制移动机器人循迹;最后,根据设计好的奖励函数计算此次动作的奖励,并得到下一个时刻的状态,在与环境的交互中不断优化强化学习网络模型,得到最优的策略网络。该方法克服了传统PID控制自适应调参中对模型和经验的依赖,在仿真和落地的实验中均取得了优异的效果,并且具备良好的泛化性和鲁棒性。

    一种适用于密集环境下的机械臂推抓系统

    公开(公告)号:CN112605983B

    公开(公告)日:2022-04-19

    申请号:CN202011386636.6

    申请日:2020-12-01

    Abstract: 一种适用于密集环境下的机械臂推抓系统,包括PC,彩色深度相机,机械臂,智能夹持器;软件端包括CoppliaSim仿真平台;彩色深度相机通过USB与计算机相连接,机械臂通过局域网与PC连接;彩色深度相机获取彩色RGB图和深度图;计算机执行机械臂控制程序;机械臂执行动作;智能夹持器抓取或推物块。CoppliaSim仿真平台包括仿真模块、标定模块、图像预处理模块、特征提取模块、决策网络模块、动作策略模块、机器人I/O模块、机器人模块。本发明利用仿真和实际相结合,减少因训练而造成的机器人损坏,并加快抓取速度;利用深度强化学习的DQN,依据当前物体环境实时动态规划动作语义,实现推和抓的结合,同时规划出最适合抓取的方向,大大增加了机械臂抓取复杂环境的成功率。

    一种适用于多种复杂路径的移动机器人循线系统

    公开(公告)号:CN113359703A

    公开(公告)日:2021-09-07

    申请号:CN202110522424.4

    申请日:2021-05-13

    Abstract: 一种适用于多种复杂路径的移动机器人循线系统,包括PC,嵌入式开发板,RGB彩色相机、移动机器人。PC上安装有仿真模块,嵌入式开发板上包括动作策略模块、PID控制器模块、图像处理模块,移动机器人上安装有机器人I/O模块。通过仿真模块训练策略最优的策略网络模型,继而应用于实际机器人系统,减少了实际系统因训练而造成的机器人损坏,提高了实际移动机器人循线任务的成功率。本发明可以在仿真环境中针对一个循线路径进行训练,训练后的网络参数模型可以应对不同的复杂的未知的循线路径,自适应地实时地计算出最优的PID控制器参数和最优运动指令,完成循线任务,具有较高的实时性、稳定性和泛化性。

    一种适用于密集环境下的机械臂推抓协同方法

    公开(公告)号:CN112643668B

    公开(公告)日:2022-05-24

    申请号:CN202011386635.1

    申请日:2020-12-01

    Abstract: 一种适用于密集环境下的机械臂推抓协同方法,分为仿真训练与实际抓取两个部分。首先在仿真环境中搭建与真实抓取相似的场景,构建FCN网络(推网络)φp和抓网络φg,由动作后的状态给出评价,以此更新φp和φg网络参数,得到训练后的网络参数文件。在实际抓取部分,搭建实际抓取环境,导入仿真训练后的深度网络参数,根据网络输出的Q值图控制机械臂动作。本发明可以通过机械臂自主决策动作(抓或推)改变抓取环境,尤其适用于物体密集环境中。

    一种适用于密集环境下的机械臂推抓协同方法

    公开(公告)号:CN112643668A

    公开(公告)日:2021-04-13

    申请号:CN202011386635.1

    申请日:2020-12-01

    Abstract: 一种基于深度强化学习的端到端机械臂推抓系统方法,分为仿真训练与实际抓取两个部分。首先在仿真环境中搭建与真实抓取相似的场景,构建FCN网络(推网络)φp和抓网络φg,由动作后的状态给出评价,以此更新φp和φg网络参数,得到训练后的网络参数文件。在实际抓取部分,搭建实际抓取环境,导入仿真训练后的深度网络参数,根据网络输出的Q值图控制机械臂动作。本发明可以通过机械臂自主决策动作(抓或推)改变抓取环境,尤其适用于物体密集环境中。

    一种适用于多种复杂路径的移动机器人循线系统

    公开(公告)号:CN113359703B

    公开(公告)日:2022-04-19

    申请号:CN202110522424.4

    申请日:2021-05-13

    Abstract: 一种适用于多种复杂路径的移动机器人循线系统,包括PC,嵌入式开发板,RGB彩色相机、移动机器人。PC上安装有仿真模块,嵌入式开发板上包括动作策略模块、PID控制器模块、图像处理模块,移动机器人上安装有机器人I/O模块。通过仿真模块训练策略最优的策略网络模型,继而应用于实际机器人系统,减少了实际系统因训练而造成的机器人损坏,提高了实际移动机器人循线任务的成功率。本发明可以在仿真环境中针对一个循线路径进行训练,训练后的网络参数模型可以应对不同的复杂的未知的循线路径,自适应地实时地计算出最优的PID控制器参数和最优运动指令,完成循线任务,具有较高的实时性、稳定性和泛化性。

    一种适用于密集环境下的机械臂推抓系统

    公开(公告)号:CN112605983A

    公开(公告)日:2021-04-06

    申请号:CN202011386636.6

    申请日:2020-12-01

    Abstract: 一种适用于密集环境下的机械臂推抓系统,包括PC,彩色深度相机,机械臂,智能夹持器;软件端包括CoppliaSim仿真平台;彩色深度相机通过USB与计算机相连接,机械臂通过局域网与PC连接;彩色深度相机获取彩色RGB图和深度图;计算机执行机械臂控制程序;机械臂执行动作;智能夹持器抓取或推物块。CoppliaSim仿真平台包括仿真模块、标定模块、图像预处理模块、特征提取模块、决策网络模块、动作策略模块、机器人I/O模块、机器人模块。本发明利用仿真和实际相结合,减少因训练而造成的机器人损坏,并加快抓取速度;利用深度强化学习的DQN,依据当前物体环境实时动态规划动作语义,实现推和抓的结合,同时规划出最适合抓取的方向,大大增加了机械臂抓取复杂环境的成功率。

Patent Agency Ranking