一种由专家规则引导神经网络学习无人机机动飞行的方法

    公开(公告)号:CN113625753B

    公开(公告)日:2023-07-07

    申请号:CN202110904660.2

    申请日:2021-08-07

    Abstract: 本申请涉及机器学习技术领域,具体涉及一种由专家规则引导神经网络学习无人机机动飞行的方法。该方法包括:步骤S1、采用模糊逻辑作为规则的表示方式将专家规则进行隶属度函数表示;步骤S2、基于满足规则的度输出无人机的次优动作决策;步骤S3、通过深度强化学习算法的一个全连接层学习对所述次优动作决策的修改,获得修改后的动作决策,最后输出的动作决策由次优动作决策和修改后的动作决策加权得到;步骤S4、以最后输出的动作决策进行神经网络算法的训练,获得收敛后的神经网络。本申请能够有效应用人类专家关于机动飞行的少量知识,使神经网络学会特定机动飞行。

    一种飞机自动控制系统、方法、电子设备及可读存储介质

    公开(公告)号:CN114660977A

    公开(公告)日:2022-06-24

    申请号:CN202210567090.7

    申请日:2022-05-24

    Inventor: 杨晟琦 于津 詹光

    Abstract: 本申请属于非电变量的控制或调节系统设计技术领域,涉及一种飞机自动控制系统,包括:兴奋抑制平衡网络模块,以当前时刻飞机飞行状态为输入,输出飞机控制模式,其中,飞机控制模式包括:兴奋模式;抑制模式,维持对飞机进行控制的机动动作不变;机动决策网络模块,在飞机控制模式为兴奋模式时,以当前时刻飞机飞行状态为输入,输出对飞机进行控制的机动动作。以及,涉及一种飞机自动控制方法,可以上述的飞机自动控制系统实施。此外,涉及一种电子设备及其一种计算机可读存储介质,在运行时能够实现上述的飞机自动控制方法。

    一种防止策略抖动的无人机控制策略强化学习生成方法

    公开(公告)号:CN115061371B

    公开(公告)日:2023-08-04

    申请号:CN202210701895.6

    申请日:2022-06-20

    Abstract: 本申请提供了一种防止策略抖动的无人机控制策略强化学习生成方法,包括:初始化无人机控制策略网络及值网络;无人机控制策略在环境中的采样;采用GAE方法,根据样本估计优势函数;在优势函数上叠加防止无人机操控策略抖动的规范化项;更新无人机控制策略网络与值网络;重复上述步骤直至收敛,从而完成无人机控制策略的强化学习。本申请提供的方法基于行为者‑评论家强化学习方法架构,将当前状态下、当前执行动作情况下切换动作所带来的收益附加值作为评价动作切换的规范化项,用以抑制不必要的动作切换,实现不改变原有最优策略情况下,有效降低强化学习方法生成策略的抖动,使强化学习生成的策略更容易应用于真实环境中。

Patent Agency Ranking