一种基于强化学习的AUV自主避障方法

    公开(公告)号:CN112947421B

    公开(公告)日:2022-09-13

    申请号:CN202110115197.3

    申请日:2021-01-28

    Abstract: 本发明公开了一种基于强化学习的AUV自主避障方法,首先设定AUV海底航行自主避障逻辑规则;如果前视声呐无法探测到障碍物,则AUV保持现有航行高度通过障碍物;如果前视声呐探测到障碍物且障碍物高度能够确定,则确定障碍物高度,拉高AUV使AUV航行高度超过障碍物通过障碍物;如果前视声呐探测到障碍物且障碍物高度无法确定,则AUV启动自主偏航策略,通过偏航方式绕过障碍物;AUV自主偏航策略采用基于策略梯度的强化学习模型确定最佳偏航角绕过障碍物。本发明综合考量了任务执行时间、偏离主航线角度与障碍物距离等多种因素,实现了在多种约束下自主实现的最优策略避障。

    一种基于拓扑信息的水下航行器协同定位方法

    公开(公告)号:CN108332756B

    公开(公告)日:2021-05-07

    申请号:CN201810143849.2

    申请日:2018-02-12

    Abstract: 本发明涉及一种基于拓扑信息的水下航行器协同定位方法,用matlab模拟出四个水下航行器的运行轨迹图,用gtsam构建出因子图,以水下航行器之间的距离作为约束条件,加入到对位姿的优化中去,使得定位更加的精确。本发明解决水下航行器由于接收不到高精度的GPS信号而产生的定位误差,经过实验验证,该方法确实可以提高定位的精度,减小误差。

    超声速飞行器耗油量不变下的航程轨迹设计方法

    公开(公告)号:CN118816901A

    公开(公告)日:2024-10-22

    申请号:CN202410801855.8

    申请日:2024-06-20

    Abstract: 本发明公开了一种超声速飞行器耗油量不变下的航程轨迹设计方法,属于航天领域,包括以下步骤:建立超声速飞行器的动力学模型,根据超声速飞行器的动力学模型得到质心运动方程;选取质量为质心运动方程的新自变量,得到飞行器新的动力学方程;设计初始的基准弹道;利用基准弹道作为初值解,对飞行器新的动力学方程进行凸化处理和离散化处理,并根据处理结果,进行凸化求解;判断求解结果是否收敛,若是,则得到耗油量不变下航程最远爬升轨迹曲线;否则,返回至重新设置基准弹道。本发明提供的一种超声速飞行器耗油量不变下的航程轨迹设计方法解决了轨迹规划问题的过于复杂,难度大的问题。

    一种超声速飞行器巡航段在线调整高度的轨迹设计方法

    公开(公告)号:CN118466546A

    公开(公告)日:2024-08-09

    申请号:CN202410687646.5

    申请日:2024-05-30

    Abstract: 本发明公开了一种超声速飞行器巡航段在线调整高度的轨迹设计方法,涉及航天领域,包括以下步骤:根据超声速飞行器的巡航高度范围,将巡航高度划分为爬升巡航高度段和下降巡航高度段,获得轨迹数据库;对任意飞行剖面的高度指令进行归一化处理,获得新轨迹数据库;当超声速飞行器接收到目标巡航高度指令时,调用新轨迹数据库,获得在目标巡航高度指令下的弹道航程、弹道倾角指令和攻角指令;根据实际的弹道高度指令和弹道倾角指令和攻角指令,获得飞行到目标巡航高度对应飞行剖面的全部弹道指令。本发明解决了现有技术无法实现超声速飞行器在巡航段内,快速并准确地为飞行器在线生成调整巡航高度的弹道指令的问题。

    一种超声速飞行器博弈突防制导方法

    公开(公告)号:CN118859913A

    公开(公告)日:2024-10-29

    申请号:CN202410860827.3

    申请日:2024-06-28

    Abstract: 本发明公开了一种超声速飞行器博弈突防制导方法。该方法包括以下步骤:根据拦截弹内外信息数据构建输入状态向量;构建博弈突防制导策略网络模型和博弈突防制导评估网络模型,根据输入状态向量和博弈突防制导评估网络模型对博弈突防制导策略网络模型进行更新;根据实时的输入状态向量和更新后的博弈突防制导策略网络模型,生成博弈突防制导指令,以控制超声速飞行器进行博弈突防制导。本发明能在拦截弹和超声速飞行器博弈双方机动能力处于均势,并且超声速飞行器程序机动突防效果差的条件下,通过生成博弈突防制导指令,在线根据博弈态势导引超声速飞行器进行博弈机动,实现对拦截弹的突防。

    一种考虑累积误差的AUV强化学习路径规划方法

    公开(公告)号:CN112880663B

    公开(公告)日:2022-07-26

    申请号:CN202110069450.6

    申请日:2021-01-19

    Abstract: 本发明公开了一种考虑累积误差的AUV强化学习路径规划方法,首先计算AUV运行的累积误差,再计算累计误差的期望和方差,最后采用Q‑Learning强化学习路径规划方法,并更改奖励策略,对AUV沿着直线运动的动作进行奖励,对AUV的转弯动作不作奖励惩罚;在每次迭代过程中生成每条路径的累积误差统计分析,选择累积误差最小的路径作为规划结果,生成最佳路径。本发明使AUV在路径规划中定性和定量分析生成路径的累积误差统计,实现在规划和控制的整个过程中有效减小定位误差累积。

    一种基于强化学习的AUV自主避障方法

    公开(公告)号:CN112947421A

    公开(公告)日:2021-06-11

    申请号:CN202110115197.3

    申请日:2021-01-28

    Abstract: 本发明公开了一种基于强化学习的AUV自主避障方法,首先设定AUV海底航行自主避障逻辑规则;如果前视声呐无法探测到障碍物,则AUV保持现有航行高度通过障碍物;如果前视声呐探测到障碍物且障碍物高度能够确定,则确定障碍物高度,拉高AUV使AUV航行高度超过障碍物通过障碍物;如果前视声呐探测到障碍物且障碍物高度无法确定,则AUV启动自主偏航策略,通过偏航方式绕过障碍物;AUV自主偏航策略采用基于策略梯度的强化学习模型确定最佳偏航角绕过障碍物。本发明综合考量了任务执行时间、偏离主航线角度与障碍物距离等多种因素,实现了在多种约束下自主实现的最优策略避障。

    一种考虑累积误差的AUV强化学习路径规划方法

    公开(公告)号:CN112880663A

    公开(公告)日:2021-06-01

    申请号:CN202110069450.6

    申请日:2021-01-19

    Abstract: 本发明公开了一种考虑累积误差的AUV强化学习路径规划方法,首先计算AUV运行的累积误差,再计算累计误差的期望和方差,最后采用Q‑Learning强化学习路径规划方法,并更改奖励策略,对AUV沿着直线运动的动作进行奖励,对AUV的转弯动作不作奖励惩罚;在每次迭代过程中生成每条路径的累积误差统计分析,选择累积误差最小的路径作为规划结果,生成最佳路径。本发明使AUV在路径规划中定性和定量分析生成路径的累积误差统计,实现在规划和控制的整个过程中有效减小定位误差累积。

Patent Agency Ranking