一种基于深度强化学习的无人机机动规避决策方法

    公开(公告)号:CN114510078B

    公开(公告)日:2022-12-09

    申请号:CN202210144676.2

    申请日:2022-02-16

    Applicant: 南通大学

    Abstract: 本发明提供了一种基于深度强化学习的无人机机动规避决策方法,属于无人机技术领域;其技术方案为:包括以下步骤:S1、依据无人机机载传感器系统获取敌我态势信息;S2、构建无人机机动规避决策深度强化学习模型结构;S3、构建层次目标导向学习模型结构;S4、依据交互训练完成无人机机动规避决策方法学习;S5、无人机机动规避决策方法部署应用。本发明的有益效果为:本发明能够赋予无人机由浅向深的学习能力,能够令无人机自主完成机动规避决策,提高无人机在战场上的生存能力。

    无人机决策模型训练方法、使用方法、设备及介质

    公开(公告)号:CN114239392A

    公开(公告)日:2022-03-25

    申请号:CN202111503559.2

    申请日:2021-12-09

    Applicant: 南通大学

    Abstract: 本申请公开了一种无人机决策模型训练方法、使用方法、设备及介质,训练方法包括:获取第一无人机的第一态势信息与第二无人机的第二态势信息;根据第一态势信息与第二态势信息生成第一融合信息并输入待训练模型的评估层网络,评估层网络基于第一策略生成分值期望,待训练模型的决策层网络根据分值期望生成第二策略并基于第二策略生成第一动作指令;向第一无人机发送第一动作指令,并获取第一无人机的第三态势信息与第二无人机的第四态势信息;将根据第三态势信息与第四态势信息生成的第二融合信息输入评估层网络以更新第一策略,直至待训练模型训练完成,得到无人机决策模型,通过该模型提升无人机的适应能力、实现无人机决策的自主化与智能化。

    无人机决策模型训练方法、使用方法、设备及介质

    公开(公告)号:CN114239392B

    公开(公告)日:2023-03-24

    申请号:CN202111503559.2

    申请日:2021-12-09

    Applicant: 南通大学

    Abstract: 本申请公开了一种无人机决策模型训练方法、使用方法、设备及介质,训练方法包括:获取第一无人机的第一态势信息与第二无人机的第二态势信息;根据第一态势信息与第二态势信息生成第一融合信息并输入待训练模型的评估层网络,评估层网络基于第一策略生成分值期望,待训练模型的决策层网络根据分值期望生成第二策略并基于第二策略生成第一动作指令;向第一无人机发送第一动作指令,并获取第一无人机的第三态势信息与第二无人机的第四态势信息;将根据第三态势信息与第四态势信息生成的第二融合信息输入评估层网络以更新第一策略,直至待训练模型训练完成,得到无人机决策模型,通过该模型提升无人机的适应能力、实现无人机决策的自主化与智能化。

    一种基于深度强化学习的无人机机动规避决策方法

    公开(公告)号:CN114510078A

    公开(公告)日:2022-05-17

    申请号:CN202210144676.2

    申请日:2022-02-16

    Applicant: 南通大学

    Abstract: 本发明提供了一种基于深度强化学习的无人机机动规避决策方法,属于无人机技术领域;其技术方案为:包括以下步骤:S1、依据无人机机载传感器系统获取敌我态势信息;S2、构建无人机机动规避决策深度强化学习模型结构;S3、构建层次目标导向学习模型结构;S4、依据交互训练完成无人机机动规避决策方法学习;S5、无人机机动规避决策方法部署应用。本发明的有益效果为:本发明能够赋予无人机由浅向深的学习能力,能够令无人机自主完成机动规避决策,提高无人机在战场上的生存能力。

Patent Agency Ranking