-
公开(公告)号:CN115373411A
公开(公告)日:2022-11-22
申请号:CN202210607157.5
申请日:2022-05-31
Applicant: 中国航空工业集团公司沈阳飞机设计研究所
Abstract: 本申请属于非电变量的控制或调节技术领域,具体涉及一种飞机自动驾驶控制策略决策方法,包括:构建判别器模型,该判别器模型的输入为飞机飞行状态、飞机控制策略分布,输出为飞机控制策略分布为专家预测的可信度;构建生成器模型,该生成器模型的输入为飞机飞行状态,输出为飞机控制策略;对判别器模型、判别器模型进行对抗训练,得到生成对抗网络模型;基于生成对抗网络模型,以飞机飞行状态为输入,输出飞机控制策略。此外,涉及一种飞机自动驾驶控制策略决策系统,用以实现上述的飞机自动驾驶控制策略决策方法。
-
公开(公告)号:CN110989649A
公开(公告)日:2020-04-10
申请号:CN201911364796.8
申请日:2019-12-26
Applicant: 中国航空工业集团公司沈阳飞机设计研究所
Abstract: 本申请属于无人机飞行器控制技术领域,特别涉及一种面向高机动固定翼无人机的飞行动作控制装置及训练方法;控制装置包括:上层控制器,用于宏观无人机飞行动作选择;下层控制器,用于对上层选择的飞行动作进行相对精细的连续引导指令优化;控制装置的训练方法包括如下步骤:对上层控制器和下层控制器进行双层神经网络控制;对所述上层控制器和下层控制器进行双层神经网络训练。本申请的面向高机动固定翼无人机的飞行动作控制装置及训练方法,通过上下两层指令协调控制,避免了只控制飞行轨迹产生的较大的指令滞后;另外,通过分层强化学习方法,避免人为设计只能覆盖数个设计点导致的局限性,且能够适应场景发生变化,实现控制器自学习和自演化。
-
公开(公告)号:CN113625753B
公开(公告)日:2023-07-07
申请号:CN202110904660.2
申请日:2021-08-07
Applicant: 中国航空工业集团公司沈阳飞机设计研究所
IPC: G05D1/10
Abstract: 本申请涉及机器学习技术领域,具体涉及一种由专家规则引导神经网络学习无人机机动飞行的方法。该方法包括:步骤S1、采用模糊逻辑作为规则的表示方式将专家规则进行隶属度函数表示;步骤S2、基于满足规则的度输出无人机的次优动作决策;步骤S3、通过深度强化学习算法的一个全连接层学习对所述次优动作决策的修改,获得修改后的动作决策,最后输出的动作决策由次优动作决策和修改后的动作决策加权得到;步骤S4、以最后输出的动作决策进行神经网络算法的训练,获得收敛后的神经网络。本申请能够有效应用人类专家关于机动飞行的少量知识,使神经网络学会特定机动飞行。
-
公开(公告)号:CN115268496A
公开(公告)日:2022-11-01
申请号:CN202210925129.8
申请日:2022-08-03
Applicant: 中国航空工业集团公司沈阳飞机设计研究所
IPC: G05D1/10
Abstract: 本申请提供了一种无人机空中对抗机动控制器设计方法,所述方法包括:根据无人机空中对抗战术语义,将无人机空中对抗分解为中远距空中对抗和近距空中对抗;在中远距空中对抗中,基于战术语义,将机动空间分解为水平机动和垂直机动,其中,所述水平机动用于控制本机与目标的相对航向和机动过程中使用的过载,所述垂直机动用于控制无人机相对于地面坐标系的爬升角;在近距空中对抗中,基于战术语义,将机动空间分解为对称平面内机动和垂直对称平面机动,所述对称平面内机动通过改变过载来控制目标在本机对称平面内的投影与本机机头指向所构成的角度,所述垂直对称平面机动通过滚转来控制目标与本机对称平面所构成的角度。
-
公开(公告)号:CN110955144B
公开(公告)日:2022-10-28
申请号:CN201911182789.6
申请日:2019-11-27
Applicant: 中国航空工业集团公司沈阳飞机设计研究所
Abstract: 本申请属于智能控制技术领域,特别涉及一种基于时间序列分析的目标发射点预测方法。包括:步骤一:离线采集空中对抗数据;步骤二:将所述空中对抗数据输入到时间序列分析神经网络中进行离线训练,生成预测模型;步骤三:将实时空中对抗数据输入所述预测模型进行在线发射动作的预测。本申请的基于时间序列分析的目标发射点预测方法,得出发射点发射动作的预测信息可以作为辅助决策提供给飞行员,飞行员结合经验知识和智能决策结果进行发射点的判断,弥补了仅凭经验进行预测的不足。
-
公开(公告)号:CN113920388A
公开(公告)日:2022-01-11
申请号:CN202111070913.7
申请日:2021-09-13
Applicant: 中国航空工业集团公司沈阳飞机设计研究所
IPC: G06V10/774 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本申请属于强化学习技术领域,具体涉及一种基于Ray的分布式强化学习方法及装置。该方法包括步骤S1、接收设置在各采样节点的远端采样函数发送来的训练数据,并存储于缓冲池;步骤S2、定期轮询缓冲池的训练数据,待训练数据之和满足数量要求之后,通知并等待所有采样节点结束采样;步骤S3、获取模型参数,并基于所述训练数据对模型进行训练,返回训练后的模型参数;步骤S4、清空所述缓冲池的数据,重复进行采样及训练的强化学习过程。本申请有效的提升强化学习算法的训练效果并降低了训练时间。
-
公开(公告)号:CN113705778A
公开(公告)日:2021-11-26
申请号:CN202110904682.9
申请日:2021-08-07
Applicant: 中国航空工业集团公司沈阳飞机设计研究所
Abstract: 本申请公开一种空中多智能体训练方法及装置。所述空中多智能体训练方法包括:获取多智能体决策模型,所述多智能体决策模型包括动作执行步长概率分布信息以及偏置因子;训练所述多智能体决策模型,在所述多智能体决策模型训练过中,所述多智能体决策模型在选取动作执行步长概率分布信息中的动作执行步长时受所述偏置因子影响。通过增加偏置因子,从而使智能体自主决策动作执行时间,指数级降低了智能体探索环境与获取奖励值的难度,智能体更容易学习宏观策略。
-
公开(公告)号:CN113743583B
公开(公告)日:2024-02-02
申请号:CN202110904687.1
申请日:2021-08-07
Applicant: 中国航空工业集团公司沈阳飞机设计研究所 , 沈阳飞机设计研究所扬州协同创新研究院有限公司
IPC: G06N3/0499 , G06N3/092 , G05D1/24
Abstract: 本申请涉及机器学习技术领域,具体涉及一种基于强化学习的智能体无效行为切换抑制方法。该方法包括:步骤S1、在记忆库中采样一个batch的样本数据;步骤S2、更新强化学习模型的内层模型策略网络与价值网络;步骤S3、固定内层网络参数,更新外层模型策略网络与价值网络,其中,引入智能体无效行为切换算子,并在外层模型相对于内层模型执行无效行为时,降低其价值网络的奖励;步骤S4、以外层模型策略网络的强化学习策略作为智能体实时交互策略并采集数据,更新所述记忆库的交互数据;步骤S5、重复上述步骤,直至模型收敛。本申请在不引入额外人工标注的条件下有效降低智能体的频繁动作切换,不影响模型收敛性能,并提升强化学习模型的鲁棒性与实用性。
-
公开(公告)号:CN117350382A
公开(公告)日:2024-01-05
申请号:CN202311225191.7
申请日:2023-09-21
Applicant: 中国航空工业集团公司沈阳飞机设计研究所
Abstract: 本申请提供了一种面向空中智能体博弈的策略多样性增强方法,所述方法包括:基于种群训练方法,构造空中智能体的二人零和博弈求解器;面向空中智能体的行为空间,以行为空间多样性最大化为目标,构建空中智能体种群;面向空中智能体的参数空间,基于参数敏感性度量,在实现种群风格多样性、防止空中智能体种群个体间过早趋同的同时,最大化种群多样性风格的利用效率,通过空中智能体代际更新记忆增强训练方法进行参数更新。本申请可有效克服了空中博弈智能体间相互克制的问题,针对空中智能体种群策略演化时出现的代际遗忘问题,基于终生学习思想,设计智能体策略记忆增强机制,实现高鲁棒性、高战斗力的空中博弈智能体。
-
公开(公告)号:CN115061371B
公开(公告)日:2023-08-04
申请号:CN202210701895.6
申请日:2022-06-20
Applicant: 中国航空工业集团公司沈阳飞机设计研究所
IPC: G05B13/04
Abstract: 本申请提供了一种防止策略抖动的无人机控制策略强化学习生成方法,包括:初始化无人机控制策略网络及值网络;无人机控制策略在环境中的采样;采用GAE方法,根据样本估计优势函数;在优势函数上叠加防止无人机操控策略抖动的规范化项;更新无人机控制策略网络与值网络;重复上述步骤直至收敛,从而完成无人机控制策略的强化学习。本申请提供的方法基于行为者‑评论家强化学习方法架构,将当前状态下、当前执行动作情况下切换动作所带来的收益附加值作为评价动作切换的规范化项,用以抑制不必要的动作切换,实现不改变原有最优策略情况下,有效降低强化学习方法生成策略的抖动,使强化学习生成的策略更容易应用于真实环境中。
-
-
-
-
-
-
-
-
-