-
公开(公告)号:CN113822409B
公开(公告)日:2022-12-06
申请号:CN202111110979.4
申请日:2021-09-18
Applicant: 中国电子科技集团公司第五十四研究所
Abstract: 本发明公开了一种基于异构多智能体强化学习的多无人机协同突防方法,属于多智能体深度强化学习领域。本发明通过构建牵引性博弈场景和结果描述性博弈场景,初始化状态、评价神经网络参数、目标神经网络参数等超参数,对智能体进行训练。训练初始时,各无人机根据状态得到动作改变二维速度,得到新的状态,并将每回合博弈经验保存于经验池中,随机抽取样本构成学习样本,不断对智能体神经网络进行更新。当训练次数完成后,保存各神经网络参数,在评估性博弈场景中对学习效果进行验证,直到达到要求的成功率,完成协同突防任务的训练。
-
公开(公告)号:CN114978407A
公开(公告)日:2022-08-30
申请号:CN202210532452.9
申请日:2022-05-12
Applicant: 中国电子科技集团公司第五十四研究所
Abstract: 本发明提供了一种基于特征工程的强化学习通信抗干扰方法,该方法包括以下步骤:在时城和频域上构建通信干扰环境;基于干扰环境和特征工程构建强化学习环境;基于强化学习环境构建强化学习通信干扰方法模型;基于干扰环境对强化学习通信抗干扰方法模型进行验证。本发明方法结构清晰,可解释性强,能够有效规避周期性随机干扰样式切换干扰,具有广泛的工业实用性。
-
公开(公告)号:CN113822409A
公开(公告)日:2021-12-21
申请号:CN202111110979.4
申请日:2021-09-18
Applicant: 中国电子科技集团公司第五十四研究所
Abstract: 本发明公开了一种基于异构多智能体强化学习的多无人机协同突防方法,属于多智能体深度强化学习领域。本发明通过构建牵引性博弈场景和结果描述性博弈场景,初始化状态、评价神经网络参数、目标神经网络参数等超参数,对智能体进行训练。训练初始时,各无人机根据状态得到动作改变二维速度,得到新的状态,并将每回合博弈经验保存于经验池中,随机抽取样本构成学习样本,不断对智能体神经网络进行更新。当训练次数完成后,保存各神经网络参数,在评估性博弈场景中对学习效果进行验证,直到达到要求的成功率,完成协同突防任务的训练。
-
公开(公告)号:CN114978407B
公开(公告)日:2024-11-26
申请号:CN202210532452.9
申请日:2022-05-12
Applicant: 中国电子科技集团公司第五十四研究所
Abstract: 本发明提供了一种基于特征工程的强化学习通信抗干扰方法,该方法包括以下步骤:在时城和频域上构建通信干扰环境;基于干扰环境和特征工程构建强化学习环境;基于强化学习环境构建强化学习通信干扰方法模型;基于干扰环境对强化学习通信抗干扰方法模型进行验证。本发明方法结构清晰,可解释性强,能够有效规避周期性随机干扰样式切换干扰,具有广泛的工业实用性。
-
公开(公告)号:CN114143210B
公开(公告)日:2024-05-03
申请号:CN202111332644.7
申请日:2021-11-11
Applicant: 中国电子科技集团公司第五十四研究所
IPC: H04L41/14 , H04L41/142 , G06N3/044 , G06N3/0464 , G06N3/048 , G06N3/084
Abstract: 本发明提供了一种基于深度学习的指挥控制网络关键节点识别方法,所述方法包括(1)构建指挥控制网络关键节点数据集,(2)构建指挥控制网络关键节点识别神经网络模型,(3)基于训练集对指挥控制网络关键节点识别神经网络模型进行学习训练,(4)将数据集输入到指挥控制网络关键节点识别神经网络模型进行测试,识别指挥控制网络的关键节点。本发明提供的基于深度学习的指挥控制关键节点识别方法,能够准确地判断指挥控制关键节点。所述方法自动化程度高,结构新颖,流程简洁,具有广泛的工业实用性。
-
公开(公告)号:CN114143210A
公开(公告)日:2022-03-04
申请号:CN202111332644.7
申请日:2021-11-11
Applicant: 中国电子科技集团公司第五十四研究所
IPC: H04L41/14 , H04L41/142 , G06N3/04 , G06N3/08
Abstract: 本发明提供了一种基于深度学习的指挥控制网络关键节点识别方法,所述方法包括(1)构建指挥控制网络关键节点数据集,(2)构建指挥控制网络关键节点识别神经网络模型,(3)基于训练集对指挥控制网络关键节点识别神经网络模型进行学习训练,(4)将数据集输入到指挥控制网络关键节点识别神经网络模型进行测试,识别指挥控制网络的关键节点。本发明提供的基于深度学习的指挥控制关键节点识别方法,能够准确地判断指挥控制关键节点。所述方法自动化程度高,结构新颖,流程简洁,具有广泛的工业实用性。
-
公开(公告)号:CN111736461B
公开(公告)日:2021-05-04
申请号:CN202010612864.4
申请日:2020-06-30
Applicant: 西安电子科技大学 , 中国电子科技集团公司第五十四研究所
Abstract: 本发明提出了一种基于Q学习的无人机任务协同分配方法,实现步骤为:初始化参数;根据无人机及任务的位置信息获取每个无人机的邻居无人机集合;确定敏感无人机和间接无人机;然后每个敏感无人机执行任务并向其邻居无人机发送通信包;根据通信包获取每个间接无人机的Q表;再初始化Q学习参数;间接无人机进行Q学习,最后获取无人机任务协同分配结果。本发明在无人机的Q学习过程中充分考虑了全局信息和局部信息,实现了对无人机自身Q表的优化,在保证所有任务均得到其所需执行量基础上有效提高了任务分配的收敛速度。
-
公开(公告)号:CN111736461A
公开(公告)日:2020-10-02
申请号:CN202010612864.4
申请日:2020-06-30
Applicant: 西安电子科技大学 , 中国电子科技集团公司第五十四研究所
Abstract: 本发明提出了一种基于Q学习的无人机任务协同分配方法,实现步骤为:初始化参数;根据无人机及任务的位置信息获取每个无人机的邻居无人机集合;确定敏感无人机和间接无人机;然后每个敏感无人机执行任务并向其邻居无人机发送通信包;根据通信包获取每个间接无人机的Q表;再初始化Q学习参数;间接无人机进行Q学习,最后获取无人机任务协同分配结果。本发明在无人机的Q学习过程中充分考虑了全局信息和局部信息,实现了对无人机自身Q表的优化,在保证所有任务均得到其所需执行量基础上有效提高了任务分配的收敛速度。
-
-
-
-
-
-
-