Patent search ap:("中国航空工业集团公司沈阳飞机设计研究所") AND inv:"冯勇明" Page 1

1.

发明公开
一种多无人机时空关键特征自学习协同对抗决策方法有权

公开(公告)号：CN115113642A

公开(公告)日：2022-09-27

申请号：CN202210624651.2

申请日：2022-06-02

Applicant: 中国航空工业集团公司沈阳飞机设计研究所

Inventor： 朴海音 , 孙阳 , 詹光 , 冯勇明 , 杨晟琦 , 于津 , 樊松源 , 张健

IPC: G05D1/10

Abstract: 本申请提供了一种多无人机时空关键特征自学习协同对抗决策方法，该方法包括如下步骤：步骤一、将空中多无人机对抗问题抽象并简化为多关系时空动力学；步骤二、萃取多机协同对抗时空图中的关键空间关联关系：步骤三、时间关联特征演化学习；步骤四、联合对抗决策优化。本申请的方法可以有效捕捉多无人机协同对抗决策的时间与空间特征关联关系，有效简化问题特征，并最终提升协同对抗决策效果。

2.

发明公开
一种基于安全强化学习的自主地面防撞方法及装置审中-实审

公开(公告)号：CN117008629A

公开(公告)日：2023-11-07

申请号：CN202310650087.6

申请日：2023-06-02

Applicant: 中国航空工业集团公司沈阳飞机设计研究所

Inventor： 卢长谦 , 彭宣淇 , 孙智孝 , 朴海音 , 冯勇明 , 孙阳 , 杨晟琦 , 张健

IPC: G05D1/10

Abstract: 本申请属于飞行控制技术领域，特别涉及一种基于安全强化学习的自主地面防撞方法及装置。该方法包括步骤S1、获取强化学习算法中的元组，所述元组由状态空间、动作空间、奖励函数及代价函数；步骤S2、基于元组中的奖励函数的期望形成回报函数，以最大化所述回报函数为目标，以所述代价函数不低于设定值为约束，构建优化策略；步骤S3、对所述优化策略进行求解，获得各时刻的最优神经网络参数中间量，基于最优神经网络参数中间量计算飞行参数，进行飞机飞行控制。本申请允许无人机智能体自由探索机动环境，并能够确保无人机位置距离地面具有足够的安全余量，从而保证飞机安全。

3.

发明公开
一种面向空中智能体博弈的策略多样性增强方法审中-实审

公开(公告)号：CN117350382A

公开(公告)日：2024-01-05

申请号：CN202311225191.7

申请日：2023-09-21

Applicant: 中国航空工业集团公司沈阳飞机设计研究所

Inventor： 郝一行 , 卢长谦 , 孙智孝 , 彭宣淇 , 朴海音 , 冯勇明 , 孙阳 , 张健

IPC: G06N5/04 , G06F18/22 , G06N3/092

Abstract: 本申请提供了一种面向空中智能体博弈的策略多样性增强方法，所述方法包括：基于种群训练方法，构造空中智能体的二人零和博弈求解器；面向空中智能体的行为空间，以行为空间多样性最大化为目标，构建空中智能体种群；面向空中智能体的参数空间，基于参数敏感性度量，在实现种群风格多样性、防止空中智能体种群个体间过早趋同的同时，最大化种群多样性风格的利用效率，通过空中智能体代际更新记忆增强训练方法进行参数更新。本申请可有效克服了空中博弈智能体间相互克制的问题，针对空中智能体种群策略演化时出现的代际遗忘问题，基于终生学习思想，设计智能体策略记忆增强机制，实现高鲁棒性、高战斗力的空中博弈智能体。

4.

发明授权
一种防止策略抖动的无人机控制策略强化学习生成方法有权

公开(公告)号：CN115061371B

公开(公告)日：2023-08-04

申请号：CN202210701895.6

申请日：2022-06-20

Applicant: 中国航空工业集团公司沈阳飞机设计研究所

Inventor： 彭宣淇 , 朴海音 , 詹光 , 孙阳 , 冯勇明 , 杨晟琦 , 于津 , 张健

IPC: G05B13/04

Abstract: 本申请提供了一种防止策略抖动的无人机控制策略强化学习生成方法，包括：初始化无人机控制策略网络及值网络；无人机控制策略在环境中的采样；采用GAE方法，根据样本估计优势函数；在优势函数上叠加防止无人机操控策略抖动的规范化项；更新无人机控制策略网络与值网络；重复上述步骤直至收敛，从而完成无人机控制策略的强化学习。本申请提供的方法基于行为者‑评论家强化学习方法架构，将当前状态下、当前执行动作情况下切换动作所带来的收益附加值作为评价动作切换的规范化项，用以抑制不必要的动作切换，实现不改变原有最优策略情况下，有效降低强化学习方法生成策略的抖动，使强化学习生成的策略更容易应用于真实环境中。

5.

发明授权
一种基于细粒度重复策略的无人机机动飞行控制方法有权

公开(公告)号：CN115097853B

公开(公告)日：2023-07-07

申请号：CN202210551472.0

申请日：2022-05-18

Applicant: 中国航空工业集团公司沈阳飞机设计研究所

Inventor： 于津 , 朴海音 , 孙阳 , 樊松源 , 詹光 , 于晓强 , 冯勇明

IPC: G05D1/08 , G05D1/10

Abstract: 本申请属于无人机智能控制领域，为一种基于细粒度重复策略的无人机机动飞行控制方法，基于无人机气动力参数构建全量六自由度模型和飞行控制率模块，用于模拟飞行控制环境，而后通过建立马尔科夫决策过程来分析各个控制指令以及对应的奖惩函数，而后通过DDPG算法和细粒度策略网络的结合形成各个控制指令与时间相对应的集合，对无人机进行控制。与传统机动控制器相比较不需要精确的线性化控制建模，能够生成连续的机动控制指令，不存在控制器切换而产生的指令反复跳变等问题。与经典的深度强化学习算法相比，该方法生成的机动飞行控制指令更加平滑，减少飞行任务中的指令有害切换次数，进而能够加快深度强化学习算法的训练速度。

6.

发明授权
一种无人机对抗策略决策方法及其系统有权

公开(公告)号：CN115268481B

公开(公告)日：2023-06-20

申请号：CN202210787640.6

申请日：2022-07-06

Applicant: 中国航空工业集团公司沈阳飞机设计研究所

Inventor： 韩玥 , 朴海音 , 李俊男 , 孙智孝 , 郝一行 , 卢长谦 , 彭宣淇 , 冯勇明

IPC: G05D1/08 , G05D1/10 , G06N3/04 , G06N3/092 , G06N3/094

Abstract: 本申请属于非电变量的控制或调节系统领域，具体涉及一种无人机对抗策略决策方法及其系统，其中，无人机对抗策略决策方法，包括：对待决策无人机的对抗态势进行抽象，构建待决策无人机对抗态势抽象图；根据待决策无人机对抗态势抽象图，识别对待决策无人机最重要的无人机，构建待决策无人机对抗关系图；根据待决策无人机对抗关系图，进行待决策无人机的态势感知、信息交互，生成待决策无人机的对抗策略。

7.

发明授权
一种无人机空中对抗机动控制器及其设计方法有权

公开(公告)号：CN115268496B

公开(公告)日：2023-08-18

申请号：CN202210925129.8

申请日：2022-08-03

Applicant: 中国航空工业集团公司沈阳飞机设计研究所

Inventor： 李俊男 , 朴海音 , 郝一行 , 孙智孝 , 卢长谦 , 彭宣淇 , 冯勇明

IPC: G05D1/10

Abstract: 本申请提供了一种无人机空中对抗机动控制器设计方法，所述方法包括：根据无人机空中对抗战术语义，将无人机空中对抗分解为中远距空中对抗和近距空中对抗；在中远距空中对抗中，基于战术语义，将机动空间分解为水平机动和垂直机动，其中，所述水平机动用于控制本机与目标的相对航向和机动过程中使用的过载，所述垂直机动用于控制无人机相对于地面坐标系的爬升角；在近距空中对抗中，基于战术语义，将机动空间分解为对称平面内机动和垂直对称平面机动，所述对称平面内机动通过改变过载来控制目标在本机对称平面内的投影与本机机头指向所构成的角度，所述垂直对称平面机动通过滚转来控制目标与本机对称平面所构成的角度。

8.

发明授权
一种多无人机时空关键特征自学习协同对抗决策方法有权

公开(公告)号：CN115113642B

公开(公告)日：2023-06-20

申请号：CN202210624651.2

申请日：2022-06-02

Applicant: 中国航空工业集团公司沈阳飞机设计研究所

Inventor： 朴海音 , 孙阳 , 詹光 , 冯勇明 , 杨晟琦 , 于津 , 樊松源 , 张健

IPC: G05D1/10

Abstract: 本申请提供了一种多无人机时空关键特征自学习协同对抗决策方法，该方法包括如下步骤：步骤一、将空中多无人机协调博弈对抗问题抽象并简化为多关系时空动力学；步骤二、萃取多机协同对抗时空图中的关键空间关联关系：步骤三、时间关联特征演化学习；步骤四、联合对抗决策优化。本申请的方法可以有效捕捉多无人机协同对抗决策的时间与空间特征关联关系，有效简化问题特征，并最终提升协同对抗决策效果。

9.

发明公开
一种防止策略抖动的无人机控制策略强化学习生成方法有权

公开(公告)号：CN115061371A

公开(公告)日：2022-09-16

申请号：CN202210701895.6

申请日：2022-06-20

Applicant: 中国航空工业集团公司沈阳飞机设计研究所

Inventor： 彭宣淇 , 朴海音 , 詹光 , 孙阳 , 冯勇明 , 杨晟琦 , 于津 , 张健

IPC: G05B13/04

Abstract: 本申请提供了一种防止策略抖动的无人机控制策略强化学习生成方法，包括：初始化无人机控制策略网络及值网络；无人机控制策略在环境中的采样；采用GAE方法，根据样本估计优势函数；在优势函数上叠加防止无人机操控策略抖动的规范化项；更新无人机控制策略网络与值网络；重复上述步骤直至收敛，从而完成无人机控制策略的强化学习。本申请提供的方法基于行为者‑评论家强化学习方法架构，将当前状态下、当前执行动作情况下切换动作所带来的收益附加值作为评价动作切换的规范化项，用以抑制不必要的动作切换，实现不改变原有最优策略情况下，有效降低强化学习方法生成策略的抖动，使强化学习生成的策略更容易应用于真实环境中。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification