基于双BP网络增强学习框架的水下机器人轨迹跟踪方法

    公开(公告)号:CN111240345B

    公开(公告)日:2023-04-07

    申请号:CN202010087514.0

    申请日:2020-02-11

    Abstract: 一种基于双BP网络增强学习框架的水下机器人轨迹跟踪方法,它属于水下机器人轨迹跟踪技术领域。本发明解决了现有技术在进行控制器参数的在线优化时,需要依赖大量的专家先验知识建立模糊规则,导致控制器参数的在线优化耗时耗力的问题。本发明利用强化学习方法可以通过与环境的不断交互,在得到环境给出的强化值后便能通过循环迭代寻找到最优策略的特点,将强化学习方法与双BP网络结合起来,通过在线调节水下机器人的速度和艏向控制系统控制律的相关参数,使得所设计的速度和艏向控制系统能在不同的环境中选择与该环境相对应的最优控制参数,克服了现有技术中控制器参数在线优化的耗时耗力的问题。本发明可以应用于水下机器人的轨迹跟踪。

    一种时滞非对称时变全状态约束下的水面无人艇轨迹跟踪控制方法

    公开(公告)号:CN111736600A

    公开(公告)日:2020-10-02

    申请号:CN202010526389.9

    申请日:2020-06-10

    Abstract: 一种时滞非对称时变全状态约束下的水面无人艇轨迹跟踪控制方法,属于控制技术领域。本发明为了解决现有的USV的轨迹跟踪控制方法并没有考虑时滞约束而导致的控制效果不佳的问题。本发明通过利用一种移位函数,实现对水面无人艇系统的误差变量进行移位转换,同时还设计了一种非对称障碍Lyapunov函数,设计相应的控制律和自适应律,保证无论初始条件如何,都可以实现最终一致有界的跟踪控制效果,而且时滞不对称时变约束可以在有限时间之后实现。主要用于水面无人艇的轨迹跟踪控制。

    一种基于强化学习技术的自主水下机器人速度和艏向控制方法

    公开(公告)号:CN111273677A

    公开(公告)日:2020-06-12

    申请号:CN202010087517.4

    申请日:2020-02-11

    Abstract: 一种基于强化学习技术的自主水下机器人速度和艏向控制方法,属于机器人控制技术领域。为了解决现有的水下机器人的控制方法依赖于控制对象模型精度的问题,以及不依赖模型的控制方法控制精度不高的问题。本发明设计了基于Q学习的速度和艏向控制器,将偏差和偏差变化率作为Q学习控制器的输入,将纵向推力和偏航力矩作为Q学习控制器的输出,使得Q学习控制器完全替代传统常规的控制器,从而达到水下机器人自主学习和自主决策的目标。主要用于水下机器人速度和艏向的控制。

    一种基于双BP神经网络Q学习技术的水下机器人参数自适应反步控制方法

    公开(公告)号:CN111176122A

    公开(公告)日:2020-05-19

    申请号:CN202010087510.2

    申请日:2020-02-11

    Abstract: 一种基于双BP神经网络Q学习技术的水下机器人参数自适应反步控制方法,它属于水下机器人控制器参数调节技术领域。本发明解决了传统Q学习方法进行控制器参数调节时的学习效率低,以及传统反步法进行控制器参数调节时存在的参数不易实时在线调整的问题。本发明利用基于双BP神经网络Q学习算法与反步法相结合的方式实现对反步法控制器参数的自主在线调节,以满足控制参数能够实时在线调整的要求。同时由于引入了双BP神经网络以及经验回放池,其强大的拟合能力使得基于双BP神经网络Q学习参数自适应反步控制方法能够大大降低训练次数,以提升学习效率,在训练较少次数的情况下达到更好的控制效果。本发明可以应用于水下机器人控制器参数的调节。

    基于强化学习技术的自主水下机器人速度和艏向控制方法

    公开(公告)号:CN111273677B

    公开(公告)日:2023-05-12

    申请号:CN202010087517.4

    申请日:2020-02-11

    Abstract: 一种基于强化学习技术的自主水下机器人速度和艏向控制方法,属于机器人控制技术领域。为了解决现有的水下机器人的控制方法依赖于控制对象模型精度的问题,以及不依赖模型的控制方法控制精度不高的问题。本发明设计了基于Q学习的速度和艏向控制器,将偏差和偏差变化率作为Q学习控制器的输入,将纵向推力和偏航力矩作为Q学习控制器的输出,使得Q学习控制器完全替代传统常规的控制器,从而达到水下机器人自主学习和自主决策的目标。主要用于水下机器人速度和艏向的控制。

    一种基于双BP神经网络Q学习技术的水下机器人参数自适应反步控制方法

    公开(公告)号:CN111176122B

    公开(公告)日:2022-05-13

    申请号:CN202010087510.2

    申请日:2020-02-11

    Abstract: 一种基于双BP神经网络Q学习技术的水下机器人参数自适应反步控制方法,它属于水下机器人控制器参数调节技术领域。本发明解决了传统Q学习方法进行控制器参数调节时的学习效率低,以及传统反步法进行控制器参数调节时存在的参数不易实时在线调整的问题。本发明利用基于双BP神经网络Q学习算法与反步法相结合的方式实现对反步法控制器参数的自主在线调节,以满足控制参数能够实时在线调整的要求。同时由于引入了双BP神经网络以及经验回放池,其强大的拟合能力使得基于双BP神经网络Q学习参数自适应反步控制方法能够大大降低训练次数,以提升学习效率,在训练较少次数的情况下达到更好的控制效果。本发明可以应用于水下机器人控制器参数的调节。

    一种可底栖式AUV的水平面轨迹快速跟踪控制方法

    公开(公告)号:CN111650948A

    公开(公告)日:2020-09-11

    申请号:CN202010523598.8

    申请日:2020-06-10

    Abstract: 一种可底栖式AUV的水平面轨迹快速跟踪控制方法,它属于自主式水下机器人的轨迹跟踪控制技术领域。本发明解决了将目前的控制方法应用到可底栖式AUV时存在的控制精度有限,且调整速度慢的问题。本发明将海流扰动、模型不确定性组合为扰动集总项,使用有限时间扰动观测器逼近扰动集总项值,并引入神经网络估计观测误差。进而提出一种基于有限时间扰动观测器的自适应神经网络反步控制器,来实现对可底栖式AUV的有限时间高精度轨迹跟踪控制。本发明可以应用于可底栖式AUV的轨迹跟踪控制。

    一种水下多足步行机器人机械足姿态跟踪控制方法

    公开(公告)号:CN111650832A

    公开(公告)日:2020-09-11

    申请号:CN202010470086.X

    申请日:2020-05-28

    Abstract: 一种水下多足步行机器人机械足姿态跟踪控制方法,它属于水下多足步行机器人机械足姿态跟踪控制技术领域。本发明解决了利用径向基神经网络逼近广义干扰时无法保证控制效果且计算量非常大,以及将预设性能方法与固定时间方法结合时控制器的设计过程繁琐复杂的问题。本发明综合考虑海流干扰、建模不确定性和执行机构故障的影响,基于区间2型模糊神经网络和预设性能终端滑模控制方法设计控制器,用于实现对UWR机械足的固定时间误差约束容错姿态跟踪控制。可以在有限计算量的工程条件下,保证UWR机械足的跟踪控制效果。且本发明的控制器设计方法较为简单,克服了现有方法中控制器设计复杂的问题。本发明可以应用于UWR机械足姿态跟踪控制。

Patent Agency Ranking