Patent search ap:("中国航空工业集团公司沈阳飞机设计研究所") AND inv:"杨晟琦" Page 1

1.

发明授权
一种由专家规则引导神经网络学习无人机机动飞行的方法有权

公开(公告)号：CN113625753B

公开(公告)日：2023-07-07

申请号：CN202110904660.2

申请日：2021-08-07

Applicant: 中国航空工业集团公司沈阳飞机设计研究所

Inventor： 朴海音 , 孙智孝 , 孙阳 , 于津 , 彭宣淇 , 韩玥 , 杨晟琦 , 李俊男

IPC: G05D1/10

Abstract: 本申请涉及机器学习技术领域，具体涉及一种由专家规则引导神经网络学习无人机机动飞行的方法。该方法包括：步骤S1、采用模糊逻辑作为规则的表示方式将专家规则进行隶属度函数表示；步骤S2、基于满足规则的度输出无人机的次优动作决策；步骤S3、通过深度强化学习算法的一个全连接层学习对所述次优动作决策的修改，获得修改后的动作决策，最后输出的动作决策由次优动作决策和修改后的动作决策加权得到；步骤S4、以最后输出的动作决策进行神经网络算法的训练，获得收敛后的神经网络。本申请能够有效应用人类专家关于机动飞行的少量知识，使神经网络学会特定机动飞行。

2.

发明授权
一种基于时间序列分析的目标发射点预测方法有权

公开(公告)号：CN110955144B

公开(公告)日：2022-10-28

申请号：CN201911182789.6

申请日：2019-11-27

Applicant: 中国航空工业集团公司沈阳飞机设计研究所

Inventor： 孙智孝 , 杨晟琦 , 朴海音 , 彭宣淇 , 孙阳 , 田明俊 , 金琳乘 , 朱金东 , 马启兵 , 李俊男 , 骆遥 , 于津

IPC: G05B13/04 , G06N3/08

Abstract: 本申请属于智能控制技术领域，特别涉及一种基于时间序列分析的目标发射点预测方法。包括：步骤一：离线采集空中对抗数据；步骤二：将所述空中对抗数据输入到时间序列分析神经网络中进行离线训练，生成预测模型；步骤三：将实时空中对抗数据输入所述预测模型进行在线发射动作的预测。本申请的基于时间序列分析的目标发射点预测方法，得出发射点发射动作的预测信息可以作为辅助决策提供给飞行员，飞行员结合经验知识和智能决策结果进行发射点的判断，弥补了仅凭经验进行预测的不足。

3.

发明公开
一种飞机自动控制系统、方法、电子设备及可读存储介质有权

公开(公告)号：CN114660977A

公开(公告)日：2022-06-24

申请号：CN202210567090.7

申请日：2022-05-24

Applicant: 中国航空工业集团公司沈阳飞机设计研究所

Inventor： 杨晟琦 , 于津 , 詹光

IPC: G05B19/042

Abstract: 本申请属于非电变量的控制或调节系统设计技术领域，涉及一种飞机自动控制系统，包括：兴奋抑制平衡网络模块，以当前时刻飞机飞行状态为输入，输出飞机控制模式，其中，飞机控制模式包括：兴奋模式；抑制模式，维持对飞机进行控制的机动动作不变；机动决策网络模块，在飞机控制模式为兴奋模式时，以当前时刻飞机飞行状态为输入，输出对飞机进行控制的机动动作。以及，涉及一种飞机自动控制方法，可以上述的飞机自动控制系统实施。此外，涉及一种电子设备及其一种计算机可读存储介质，在运行时能够实现上述的飞机自动控制方法。

4.

发明公开
一种基于Ray的分布式强化学习方法及装置审中-实审

公开(公告)号：CN113920388A

公开(公告)日：2022-01-11

申请号：CN202111070913.7

申请日：2021-09-13

Applicant: 中国航空工业集团公司沈阳飞机设计研究所

Inventor： 樊松源 , 朴海音 , 孙智孝 , 孙阳 , 于津 , 彭宣淇 , 韩玥 , 杨晟琦 , 詹光 , 郎魁军

IPC: G06V10/774 , G06K9/62 , G06N3/04 , G06N3/08

Abstract: 本申请属于强化学习技术领域，具体涉及一种基于Ray的分布式强化学习方法及装置。该方法包括步骤S1、接收设置在各采样节点的远端采样函数发送来的训练数据，并存储于缓冲池；步骤S2、定期轮询缓冲池的训练数据，待训练数据之和满足数量要求之后，通知并等待所有采样节点结束采样；步骤S3、获取模型参数，并基于所述训练数据对模型进行训练，返回训练后的模型参数；步骤S4、清空所述缓冲池的数据，重复进行采样及训练的强化学习过程。本申请有效的提升强化学习算法的训练效果并降低了训练时间。

5.

发明公开
一种空中多智能体训练方法及装置审中-实审

公开(公告)号：CN113705778A

公开(公告)日：2021-11-26

申请号：CN202110904682.9

申请日：2021-08-07

Applicant: 中国航空工业集团公司沈阳飞机设计研究所

Inventor： 彭宣淇 , 朴海音 , 孙智孝 , 韩玥 , 杨晟琦 , 樊松源 , 孙阳 , 于津 , 田明俊 , 金琳乘

IPC: G06N3/04 , G06N20/00 , G05D1/12

Abstract: 本申请公开一种空中多智能体训练方法及装置。所述空中多智能体训练方法包括：获取多智能体决策模型，所述多智能体决策模型包括动作执行步长概率分布信息以及偏置因子；训练所述多智能体决策模型，在所述多智能体决策模型训练过中，所述多智能体决策模型在选取动作执行步长概率分布信息中的动作执行步长时受所述偏置因子影响。通过增加偏置因子，从而使智能体自主决策动作执行时间，指数级降低了智能体探索环境与获取奖励值的难度，智能体更容易学习宏观策略。

6.

发明公开
一种飞机自动驾驶控制策略决策方法及其系统无效

公开(公告)号：CN115373411A

公开(公告)日：2022-11-22

申请号：CN202210607157.5

申请日：2022-05-31

Applicant: 中国航空工业集团公司沈阳飞机设计研究所

Inventor： 孙阳 , 朴海音 , 杨晟琦 , 彭宣淇 , 樊松原 , 韩玥 , 李俊男 , 于津 , 卢长谦

IPC: G05D1/08 , G05D1/10

Abstract: 本申请属于非电变量的控制或调节技术领域，具体涉及一种飞机自动驾驶控制策略决策方法，包括：构建判别器模型，该判别器模型的输入为飞机飞行状态、飞机控制策略分布，输出为飞机控制策略分布为专家预测的可信度；构建生成器模型，该生成器模型的输入为飞机飞行状态，输出为飞机控制策略；对判别器模型、判别器模型进行对抗训练，得到生成对抗网络模型；基于生成对抗网络模型，以飞机飞行状态为输入，输出飞机控制策略。此外，涉及一种飞机自动驾驶控制策略决策系统，用以实现上述的飞机自动驾驶控制策略决策方法。

7.

发明公开
一种多无人机时空关键特征自学习协同对抗决策方法有权

公开(公告)号：CN115113642A

公开(公告)日：2022-09-27

申请号：CN202210624651.2

申请日：2022-06-02

Applicant: 中国航空工业集团公司沈阳飞机设计研究所

Inventor： 朴海音 , 孙阳 , 詹光 , 冯勇明 , 杨晟琦 , 于津 , 樊松源 , 张健

IPC: G05D1/10

Abstract: 本申请提供了一种多无人机时空关键特征自学习协同对抗决策方法，该方法包括如下步骤：步骤一、将空中多无人机对抗问题抽象并简化为多关系时空动力学；步骤二、萃取多机协同对抗时空图中的关键空间关联关系：步骤三、时间关联特征演化学习；步骤四、联合对抗决策优化。本申请的方法可以有效捕捉多无人机协同对抗决策的时间与空间特征关联关系，有效简化问题特征，并最终提升协同对抗决策效果。

8.

发明公开
面向高机动固定翼无人机的飞行动作控制装置及训练方法有权

公开(公告)号：CN110989649A

公开(公告)日：2020-04-10

申请号：CN201911364796.8

申请日：2019-12-26

Applicant: 中国航空工业集团公司沈阳飞机设计研究所

Inventor： 朴海音 , 孙智孝 , 孙阳 , 彭宣淇 , 杨晟琦 , 李思凝 , 费思邈 , 闫传博 , 姚宗信 , 刘仲 , 葛俊 , 史贵超

IPC: G05D1/08 , G05D1/10 , G06N3/04 , G06N3/08

Abstract: 本申请属于无人机飞行器控制技术领域，特别涉及一种面向高机动固定翼无人机的飞行动作控制装置及训练方法；控制装置包括：上层控制器，用于宏观无人机飞行动作选择；下层控制器，用于对上层选择的飞行动作进行相对精细的连续引导指令优化；控制装置的训练方法包括如下步骤：对上层控制器和下层控制器进行双层神经网络控制；对所述上层控制器和下层控制器进行双层神经网络训练。本申请的面向高机动固定翼无人机的飞行动作控制装置及训练方法，通过上下两层指令协调控制，避免了只控制飞行轨迹产生的较大的指令滞后；另外，通过分层强化学习方法，避免人为设计只能覆盖数个设计点导致的局限性，且能够适应场景发生变化，实现控制器自学习和自演化。

9.

发明授权
一种基于强化学习的智能体无效行为切换抑制方法有权

公开(公告)号：CN113743583B

公开(公告)日：2024-02-02

申请号：CN202110904687.1

申请日：2021-08-07

Applicant: 中国航空工业集团公司沈阳飞机设计研究所 , 沈阳飞机设计研究所扬州协同创新研究院有限公司

Inventor： 郝一行 , 朴海音 , 陈永红 , 陶晓洋 , 王汉 , 于津 , 韩玥 , 杨晟琦 , 彭宣淇 , 孙阳 , 叶超 , 樊松源

IPC: G06N3/0499 , G06N3/092 , G05D1/24

Abstract: 本申请涉及机器学习技术领域，具体涉及一种基于强化学习的智能体无效行为切换抑制方法。该方法包括：步骤S1、在记忆库中采样一个batch的样本数据；步骤S2、更新强化学习模型的内层模型策略网络与价值网络；步骤S3、固定内层网络参数，更新外层模型策略网络与价值网络，其中，引入智能体无效行为切换算子，并在外层模型相对于内层模型执行无效行为时，降低其价值网络的奖励；步骤S4、以外层模型策略网络的强化学习策略作为智能体实时交互策略并采集数据，更新所述记忆库的交互数据；步骤S5、重复上述步骤，直至模型收敛。本申请在不引入额外人工标注的条件下有效降低智能体的频繁动作切换，不影响模型收敛性能，并提升强化学习模型的鲁棒性与实用性。

10.

发明授权
一种防止策略抖动的无人机控制策略强化学习生成方法有权

公开(公告)号：CN115061371B

公开(公告)日：2023-08-04

申请号：CN202210701895.6

申请日：2022-06-20

Applicant: 中国航空工业集团公司沈阳飞机设计研究所

Inventor： 彭宣淇 , 朴海音 , 詹光 , 孙阳 , 冯勇明 , 杨晟琦 , 于津 , 张健

IPC: G05B13/04

Abstract: 本申请提供了一种防止策略抖动的无人机控制策略强化学习生成方法，包括：初始化无人机控制策略网络及值网络；无人机控制策略在环境中的采样；采用GAE方法，根据样本估计优势函数；在优势函数上叠加防止无人机操控策略抖动的规范化项；更新无人机控制策略网络与值网络；重复上述步骤直至收敛，从而完成无人机控制策略的强化学习。本申请提供的方法基于行为者‑评论家强化学习方法架构，将当前状态下、当前执行动作情况下切换动作所带来的收益附加值作为评价动作切换的规范化项，用以抑制不必要的动作切换，实现不改变原有最优策略情况下，有效降低强化学习方法生成策略的抖动，使强化学习生成的策略更容易应用于真实环境中。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification