Patent search ap:("中国电子科技集团公司第五十四研究所") AND inv:"赵研" Page 1

1.

发明授权
一种基于异构多智能体强化学习的多无人机协同突防方法有权

公开(公告)号：CN113822409B

公开(公告)日：2022-12-06

申请号：CN202111110979.4

申请日：2021-09-18

Applicant: 中国电子科技集团公司第五十四研究所

Inventor： 畅鑫 , 李艳斌 , 赵研 , 杜宇峰

IPC: G06N3/02 , G06N3/08 , G06K9/62

Abstract: 本发明公开了一种基于异构多智能体强化学习的多无人机协同突防方法，属于多智能体深度强化学习领域。本发明通过构建牵引性博弈场景和结果描述性博弈场景，初始化状态、评价神经网络参数、目标神经网络参数等超参数，对智能体进行训练。训练初始时，各无人机根据状态得到动作改变二维速度，得到新的状态，并将每回合博弈经验保存于经验池中，随机抽取样本构成学习样本，不断对智能体神经网络进行更新。当训练次数完成后，保存各神经网络参数，在评估性博弈场景中对学习效果进行验证，直到达到要求的成功率，完成协同突防任务的训练。

2.

发明公开
一种基于特征工程的强化学习通信抗干扰方法有权

公开(公告)号：CN114978407A

公开(公告)日：2022-08-30

申请号：CN202210532452.9

申请日：2022-05-12

Applicant: 中国电子科技集团公司第五十四研究所

Inventor： 畅鑫 , 李艳斌 , 赵研 , 杜宇峰

IPC: H04K3/00 , G06N20/00

Abstract: 本发明提供了一种基于特征工程的强化学习通信抗干扰方法，该方法包括以下步骤：在时城和频域上构建通信干扰环境；基于干扰环境和特征工程构建强化学习环境；基于强化学习环境构建强化学习通信干扰方法模型；基于干扰环境对强化学习通信抗干扰方法模型进行验证。本发明方法结构清晰，可解释性强，能够有效规避周期性随机干扰样式切换干扰，具有广泛的工业实用性。

3.

发明公开
一种基于异构多智能体强化学习的多无人机协同突防方法有权

公开(公告)号：CN113822409A

公开(公告)日：2021-12-21

申请号：CN202111110979.4

申请日：2021-09-18

Applicant: 中国电子科技集团公司第五十四研究所

Inventor： 畅鑫 , 李艳斌 , 赵研 , 杜宇峰

IPC: G06N3/02 , G06N3/08 , G06K9/62

Abstract: 本发明公开了一种基于异构多智能体强化学习的多无人机协同突防方法，属于多智能体深度强化学习领域。本发明通过构建牵引性博弈场景和结果描述性博弈场景，初始化状态、评价神经网络参数、目标神经网络参数等超参数，对智能体进行训练。训练初始时，各无人机根据状态得到动作改变二维速度，得到新的状态，并将每回合博弈经验保存于经验池中，随机抽取样本构成学习样本，不断对智能体神经网络进行更新。当训练次数完成后，保存各神经网络参数，在评估性博弈场景中对学习效果进行验证，直到达到要求的成功率，完成协同突防任务的训练。

4.

发明授权
一种基于特征工程的强化学习通信抗干扰方法有权

公开(公告)号：CN114978407B

公开(公告)日：2024-11-26

申请号：CN202210532452.9

申请日：2022-05-12

Applicant: 中国电子科技集团公司第五十四研究所

Inventor： 畅鑫 , 李艳斌 , 赵研 , 杜宇峰

IPC: H04K3/00 , G06N20/00

Abstract: 本发明提供了一种基于特征工程的强化学习通信抗干扰方法，该方法包括以下步骤：在时城和频域上构建通信干扰环境；基于干扰环境和特征工程构建强化学习环境；基于强化学习环境构建强化学习通信干扰方法模型；基于干扰环境对强化学习通信抗干扰方法模型进行验证。本发明方法结构清晰，可解释性强，能够有效规避周期性随机干扰样式切换干扰，具有广泛的工业实用性。

5.

发明授权
一种基于深度学习的指挥控制网络关键节点识别方法有权

公开(公告)号：CN114143210B

公开(公告)日：2024-05-03

申请号：CN202111332644.7

申请日：2021-11-11

Applicant: 中国电子科技集团公司第五十四研究所

Inventor： 畅鑫 , 李艳斌 , 赵研 , 杜宇峰

IPC: H04L41/14 , H04L41/142 , G06N3/044 , G06N3/0464 , G06N3/048 , G06N3/084

Abstract: 本发明提供了一种基于深度学习的指挥控制网络关键节点识别方法，所述方法包括(1)构建指挥控制网络关键节点数据集，(2)构建指挥控制网络关键节点识别神经网络模型，(3)基于训练集对指挥控制网络关键节点识别神经网络模型进行学习训练，(4)将数据集输入到指挥控制网络关键节点识别神经网络模型进行测试，识别指挥控制网络的关键节点。本发明提供的基于深度学习的指挥控制关键节点识别方法，能够准确地判断指挥控制关键节点。所述方法自动化程度高，结构新颖，流程简洁，具有广泛的工业实用性。

6.

发明公开
一种基于深度学习的指挥控制网络关键节点识别方法有权

公开(公告)号：CN114143210A

公开(公告)日：2022-03-04

申请号：CN202111332644.7

申请日：2021-11-11

Applicant: 中国电子科技集团公司第五十四研究所

Inventor： 畅鑫 , 李艳斌 , 赵研 , 杜宇峰

IPC: H04L41/14 , H04L41/142 , G06N3/04 , G06N3/08

Abstract: 本发明提供了一种基于深度学习的指挥控制网络关键节点识别方法，所述方法包括(1)构建指挥控制网络关键节点数据集，(2)构建指挥控制网络关键节点识别神经网络模型，(3)基于训练集对指挥控制网络关键节点识别神经网络模型进行学习训练，(4)将数据集输入到指挥控制网络关键节点识别神经网络模型进行测试，识别指挥控制网络的关键节点。本发明提供的基于深度学习的指挥控制关键节点识别方法，能够准确地判断指挥控制关键节点。所述方法自动化程度高，结构新颖，流程简洁，具有广泛的工业实用性。

7.

发明授权
基于Q学习的无人机任务协同分配方法有权

公开(公告)号：CN111736461B

公开(公告)日：2021-05-04

申请号：CN202010612864.4

申请日：2020-06-30

Applicant: 西安电子科技大学 , 中国电子科技集团公司第五十四研究所

Inventor： 方敏 , 陈烨 , 刘玉阳 , 刘冀川 , 赵研 , 郑光勇 , 柳始良

IPC: G05B13/02 , G06N20/00

Abstract: 本发明提出了一种基于Q学习的无人机任务协同分配方法，实现步骤为：初始化参数；根据无人机及任务的位置信息获取每个无人机的邻居无人机集合；确定敏感无人机和间接无人机；然后每个敏感无人机执行任务并向其邻居无人机发送通信包；根据通信包获取每个间接无人机的Q表；再初始化Q学习参数；间接无人机进行Q学习，最后获取无人机任务协同分配结果。本发明在无人机的Q学习过程中充分考虑了全局信息和局部信息，实现了对无人机自身Q表的优化，在保证所有任务均得到其所需执行量基础上有效提高了任务分配的收敛速度。

8.

发明公开
基于Q学习的无人机任务协同分配方法有权

公开(公告)号：CN111736461A

公开(公告)日：2020-10-02

申请号：CN202010612864.4

申请日：2020-06-30

Applicant: 西安电子科技大学 , 中国电子科技集团公司第五十四研究所

Inventor： 方敏 , 陈烨 , 刘玉阳 , 刘冀川 , 赵研 , 郑光勇 , 柳始良

IPC: G05B13/02 , G06N20/00

Abstract: 本发明提出了一种基于Q学习的无人机任务协同分配方法，实现步骤为：初始化参数；根据无人机及任务的位置信息获取每个无人机的邻居无人机集合；确定敏感无人机和间接无人机；然后每个敏感无人机执行任务并向其邻居无人机发送通信包；根据通信包获取每个间接无人机的Q表；再初始化Q学习参数；间接无人机进行Q学习，最后获取无人机任务协同分配结果。本发明在无人机的Q学习过程中充分考虑了全局信息和局部信息，实现了对无人机自身Q表的优化，在保证所有任务均得到其所需执行量基础上有效提高了任务分配的收敛速度。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification