一种由专家规则引导神经网络学习无人机机动飞行的方法

    公开(公告)号:CN113625753B

    公开(公告)日:2023-07-07

    申请号:CN202110904660.2

    申请日:2021-08-07

    Abstract: 本申请涉及机器学习技术领域,具体涉及一种由专家规则引导神经网络学习无人机机动飞行的方法。该方法包括:步骤S1、采用模糊逻辑作为规则的表示方式将专家规则进行隶属度函数表示;步骤S2、基于满足规则的度输出无人机的次优动作决策;步骤S3、通过深度强化学习算法的一个全连接层学习对所述次优动作决策的修改,获得修改后的动作决策,最后输出的动作决策由次优动作决策和修改后的动作决策加权得到;步骤S4、以最后输出的动作决策进行神经网络算法的训练,获得收敛后的神经网络。本申请能够有效应用人类专家关于机动飞行的少量知识,使神经网络学会特定机动飞行。

    一种无人机空中对抗机动控制器及其设计方法

    公开(公告)号:CN115268496A

    公开(公告)日:2022-11-01

    申请号:CN202210925129.8

    申请日:2022-08-03

    Abstract: 本申请提供了一种无人机空中对抗机动控制器设计方法,所述方法包括:根据无人机空中对抗战术语义,将无人机空中对抗分解为中远距空中对抗和近距空中对抗;在中远距空中对抗中,基于战术语义,将机动空间分解为水平机动和垂直机动,其中,所述水平机动用于控制本机与目标的相对航向和机动过程中使用的过载,所述垂直机动用于控制无人机相对于地面坐标系的爬升角;在近距空中对抗中,基于战术语义,将机动空间分解为对称平面内机动和垂直对称平面机动,所述对称平面内机动通过改变过载来控制目标在本机对称平面内的投影与本机机头指向所构成的角度,所述垂直对称平面机动通过滚转来控制目标与本机对称平面所构成的角度。

    一种面向空中智能体博弈的策略多样性增强方法

    公开(公告)号:CN117350382A

    公开(公告)日:2024-01-05

    申请号:CN202311225191.7

    申请日:2023-09-21

    Abstract: 本申请提供了一种面向空中智能体博弈的策略多样性增强方法,所述方法包括:基于种群训练方法,构造空中智能体的二人零和博弈求解器;面向空中智能体的行为空间,以行为空间多样性最大化为目标,构建空中智能体种群;面向空中智能体的参数空间,基于参数敏感性度量,在实现种群风格多样性、防止空中智能体种群个体间过早趋同的同时,最大化种群多样性风格的利用效率,通过空中智能体代际更新记忆增强训练方法进行参数更新。本申请可有效克服了空中博弈智能体间相互克制的问题,针对空中智能体种群策略演化时出现的代际遗忘问题,基于终生学习思想,设计智能体策略记忆增强机制,实现高鲁棒性、高战斗力的空中博弈智能体。

    一种防止策略抖动的无人机控制策略强化学习生成方法

    公开(公告)号:CN115061371B

    公开(公告)日:2023-08-04

    申请号:CN202210701895.6

    申请日:2022-06-20

    Abstract: 本申请提供了一种防止策略抖动的无人机控制策略强化学习生成方法,包括:初始化无人机控制策略网络及值网络;无人机控制策略在环境中的采样;采用GAE方法,根据样本估计优势函数;在优势函数上叠加防止无人机操控策略抖动的规范化项;更新无人机控制策略网络与值网络;重复上述步骤直至收敛,从而完成无人机控制策略的强化学习。本申请提供的方法基于行为者‑评论家强化学习方法架构,将当前状态下、当前执行动作情况下切换动作所带来的收益附加值作为评价动作切换的规范化项,用以抑制不必要的动作切换,实现不改变原有最优策略情况下,有效降低强化学习方法生成策略的抖动,使强化学习生成的策略更容易应用于真实环境中。

Patent Agency Ranking