一种基于异构多智能体强化学习的多无人机协同突防方法

    公开(公告)号:CN113822409B

    公开(公告)日:2022-12-06

    申请号:CN202111110979.4

    申请日:2021-09-18

    Abstract: 本发明公开了一种基于异构多智能体强化学习的多无人机协同突防方法,属于多智能体深度强化学习领域。本发明通过构建牵引性博弈场景和结果描述性博弈场景,初始化状态、评价神经网络参数、目标神经网络参数等超参数,对智能体进行训练。训练初始时,各无人机根据状态得到动作改变二维速度,得到新的状态,并将每回合博弈经验保存于经验池中,随机抽取样本构成学习样本,不断对智能体神经网络进行更新。当训练次数完成后,保存各神经网络参数,在评估性博弈场景中对学习效果进行验证,直到达到要求的成功率,完成协同突防任务的训练。

    一种基于异构多智能体强化学习的多无人机协同突防方法

    公开(公告)号:CN113822409A

    公开(公告)日:2021-12-21

    申请号:CN202111110979.4

    申请日:2021-09-18

    Abstract: 本发明公开了一种基于异构多智能体强化学习的多无人机协同突防方法,属于多智能体深度强化学习领域。本发明通过构建牵引性博弈场景和结果描述性博弈场景,初始化状态、评价神经网络参数、目标神经网络参数等超参数,对智能体进行训练。训练初始时,各无人机根据状态得到动作改变二维速度,得到新的状态,并将每回合博弈经验保存于经验池中,随机抽取样本构成学习样本,不断对智能体神经网络进行更新。当训练次数完成后,保存各神经网络参数,在评估性博弈场景中对学习效果进行验证,直到达到要求的成功率,完成协同突防任务的训练。

    一种基于深度学习的指挥控制网络关键节点识别方法

    公开(公告)号:CN114143210A

    公开(公告)日:2022-03-04

    申请号:CN202111332644.7

    申请日:2021-11-11

    Abstract: 本发明提供了一种基于深度学习的指挥控制网络关键节点识别方法,所述方法包括(1)构建指挥控制网络关键节点数据集,(2)构建指挥控制网络关键节点识别神经网络模型,(3)基于训练集对指挥控制网络关键节点识别神经网络模型进行学习训练,(4)将数据集输入到指挥控制网络关键节点识别神经网络模型进行测试,识别指挥控制网络的关键节点。本发明提供的基于深度学习的指挥控制关键节点识别方法,能够准确地判断指挥控制关键节点。所述方法自动化程度高,结构新颖,流程简洁,具有广泛的工业实用性。

    基于Q学习的无人机任务协同分配方法

    公开(公告)号:CN111736461B

    公开(公告)日:2021-05-04

    申请号:CN202010612864.4

    申请日:2020-06-30

    Abstract: 本发明提出了一种基于Q学习的无人机任务协同分配方法,实现步骤为:初始化参数;根据无人机及任务的位置信息获取每个无人机的邻居无人机集合;确定敏感无人机和间接无人机;然后每个敏感无人机执行任务并向其邻居无人机发送通信包;根据通信包获取每个间接无人机的Q表;再初始化Q学习参数;间接无人机进行Q学习,最后获取无人机任务协同分配结果。本发明在无人机的Q学习过程中充分考虑了全局信息和局部信息,实现了对无人机自身Q表的优化,在保证所有任务均得到其所需执行量基础上有效提高了任务分配的收敛速度。

    基于Q学习的无人机任务协同分配方法

    公开(公告)号:CN111736461A

    公开(公告)日:2020-10-02

    申请号:CN202010612864.4

    申请日:2020-06-30

    Abstract: 本发明提出了一种基于Q学习的无人机任务协同分配方法,实现步骤为:初始化参数;根据无人机及任务的位置信息获取每个无人机的邻居无人机集合;确定敏感无人机和间接无人机;然后每个敏感无人机执行任务并向其邻居无人机发送通信包;根据通信包获取每个间接无人机的Q表;再初始化Q学习参数;间接无人机进行Q学习,最后获取无人机任务协同分配结果。本发明在无人机的Q学习过程中充分考虑了全局信息和局部信息,实现了对无人机自身Q表的优化,在保证所有任务均得到其所需执行量基础上有效提高了任务分配的收敛速度。

Patent Agency Ranking