一种基于安全强化学习的自主地面防撞方法及装置

    公开(公告)号:CN117008629A

    公开(公告)日:2023-11-07

    申请号:CN202310650087.6

    申请日:2023-06-02

    Abstract: 本申请属于飞行控制技术领域,特别涉及一种基于安全强化学习的自主地面防撞方法及装置。该方法包括步骤S1、获取强化学习算法中的元组,所述元组由状态空间、动作空间、奖励函数及代价函数;步骤S2、基于元组中的奖励函数的期望形成回报函数,以最大化所述回报函数为目标,以所述代价函数不低于设定值为约束,构建优化策略;步骤S3、对所述优化策略进行求解,获得各时刻的最优神经网络参数中间量,基于最优神经网络参数中间量计算飞行参数,进行飞机飞行控制。本申请允许无人机智能体自由探索机动环境,并能够确保无人机位置距离地面具有足够的安全余量,从而保证飞机安全。

    一种面向空中智能体博弈的策略多样性增强方法

    公开(公告)号:CN117350382A

    公开(公告)日:2024-01-05

    申请号:CN202311225191.7

    申请日:2023-09-21

    Abstract: 本申请提供了一种面向空中智能体博弈的策略多样性增强方法,所述方法包括:基于种群训练方法,构造空中智能体的二人零和博弈求解器;面向空中智能体的行为空间,以行为空间多样性最大化为目标,构建空中智能体种群;面向空中智能体的参数空间,基于参数敏感性度量,在实现种群风格多样性、防止空中智能体种群个体间过早趋同的同时,最大化种群多样性风格的利用效率,通过空中智能体代际更新记忆增强训练方法进行参数更新。本申请可有效克服了空中博弈智能体间相互克制的问题,针对空中智能体种群策略演化时出现的代际遗忘问题,基于终生学习思想,设计智能体策略记忆增强机制,实现高鲁棒性、高战斗力的空中博弈智能体。

    一种防止策略抖动的无人机控制策略强化学习生成方法

    公开(公告)号:CN115061371B

    公开(公告)日:2023-08-04

    申请号:CN202210701895.6

    申请日:2022-06-20

    Abstract: 本申请提供了一种防止策略抖动的无人机控制策略强化学习生成方法,包括:初始化无人机控制策略网络及值网络;无人机控制策略在环境中的采样;采用GAE方法,根据样本估计优势函数;在优势函数上叠加防止无人机操控策略抖动的规范化项;更新无人机控制策略网络与值网络;重复上述步骤直至收敛,从而完成无人机控制策略的强化学习。本申请提供的方法基于行为者‑评论家强化学习方法架构,将当前状态下、当前执行动作情况下切换动作所带来的收益附加值作为评价动作切换的规范化项,用以抑制不必要的动作切换,实现不改变原有最优策略情况下,有效降低强化学习方法生成策略的抖动,使强化学习生成的策略更容易应用于真实环境中。

    一种基于细粒度重复策略的无人机机动飞行控制方法

    公开(公告)号:CN115097853B

    公开(公告)日:2023-07-07

    申请号:CN202210551472.0

    申请日:2022-05-18

    Abstract: 本申请属于无人机智能控制领域,为一种基于细粒度重复策略的无人机机动飞行控制方法,基于无人机气动力参数构建全量六自由度模型和飞行控制率模块,用于模拟飞行控制环境,而后通过建立马尔科夫决策过程来分析各个控制指令以及对应的奖惩函数,而后通过DDPG算法和细粒度策略网络的结合形成各个控制指令与时间相对应的集合,对无人机进行控制。与传统机动控制器相比较不需要精确的线性化控制建模,能够生成连续的机动控制指令,不存在控制器切换而产生的指令反复跳变等问题。与经典的深度强化学习算法相比,该方法生成的机动飞行控制指令更加平滑,减少飞行任务中的指令有害切换次数,进而能够加快深度强化学习算法的训练速度。

    一种无人机空中对抗机动控制器及其设计方法

    公开(公告)号:CN115268496B

    公开(公告)日:2023-08-18

    申请号:CN202210925129.8

    申请日:2022-08-03

    Abstract: 本申请提供了一种无人机空中对抗机动控制器设计方法,所述方法包括:根据无人机空中对抗战术语义,将无人机空中对抗分解为中远距空中对抗和近距空中对抗;在中远距空中对抗中,基于战术语义,将机动空间分解为水平机动和垂直机动,其中,所述水平机动用于控制本机与目标的相对航向和机动过程中使用的过载,所述垂直机动用于控制无人机相对于地面坐标系的爬升角;在近距空中对抗中,基于战术语义,将机动空间分解为对称平面内机动和垂直对称平面机动,所述对称平面内机动通过改变过载来控制目标在本机对称平面内的投影与本机机头指向所构成的角度,所述垂直对称平面机动通过滚转来控制目标与本机对称平面所构成的角度。

    一种防止策略抖动的无人机控制策略强化学习生成方法

    公开(公告)号:CN115061371A

    公开(公告)日:2022-09-16

    申请号:CN202210701895.6

    申请日:2022-06-20

    Abstract: 本申请提供了一种防止策略抖动的无人机控制策略强化学习生成方法,包括:初始化无人机控制策略网络及值网络;无人机控制策略在环境中的采样;采用GAE方法,根据样本估计优势函数;在优势函数上叠加防止无人机操控策略抖动的规范化项;更新无人机控制策略网络与值网络;重复上述步骤直至收敛,从而完成无人机控制策略的强化学习。本申请提供的方法基于行为者‑评论家强化学习方法架构,将当前状态下、当前执行动作情况下切换动作所带来的收益附加值作为评价动作切换的规范化项,用以抑制不必要的动作切换,实现不改变原有最优策略情况下,有效降低强化学习方法生成策略的抖动,使强化学习生成的策略更容易应用于真实环境中。

Patent Agency Ranking