一种基于CEL-MADDPG的多无人机围捕策略方法

    公开(公告)号:CN115097861B

    公开(公告)日:2024-04-26

    申请号:CN202210525305.9

    申请日:2022-05-15

    Abstract: 本发明提供了一种基于CEL‑MADDPG的多无人机围捕策略方法,建立一种基于多智能体深度确定性策略梯度算法的框架,将多无人机围捕任务拆分为目标追踪、包围过渡、靠近捕获三个子任务,通过设立三种奖励函数帮助多无人机对围捕过程中的各子任务进行学习,通过引入相关性指标对样本采样效率进行改进,最终,提出的基于课程经验学习的多无人机围捕策略方法能够帮助无人机在动态复杂环境下,成功追踪接近目标,并实现对目标的包围捕获。本发明能够实现无人机自主决策,且各无人机产生的行为策略协同性更强,能够使多无人机学习到更为合理的围捕策略,提升多无人机围捕模型训练效率,且构建的多无人机决策模型具有更好的围捕性能。

    一种主被动协同冷却的水下航行器电池组热管理系统

    公开(公告)号:CN113809449B

    公开(公告)日:2023-09-19

    申请号:CN202110999353.7

    申请日:2021-08-28

    Abstract: 为解决现有对航行器电池组进行热管理的方案无法保证电池间温度的均匀性、不具备经济性的技术问题,本发明提供了一种主被动协同冷却的水下航行器电池组热管理系统,针对航行器低、高速航行两种工作模式,分别采用被动冷却和主被动协同冷却的方式,匹配电池组的温控需求,有利于实现电池组的长航时供电。其中:主动冷却采用液冷系统实现,被动冷却采用高导热定型相变材料模块组件实现;在低速工况下,利用高导热定型相变材料模块组件将电池模组产生的热量以潜热的方式进行存储,防止电池模组温度快速上升;在高速工况下,采用主被动联合冷却,利用液冷系统将相变材料吸收的热量通过冷却剂与航行器壳体外的海水进行热交换,降低电池组的最高温度。

    一种基于链路距离感知的资源分配方法

    公开(公告)号:CN109769251B

    公开(公告)日:2022-12-30

    申请号:CN201811560364.X

    申请日:2018-12-20

    Abstract: 本发明提供了一种基于链路距离感知的资源分配方法,按照分环的半径,从远至近分别为每个圆环中的节点分配基本时隙,依次寻找可用的数据传输时隙,将其中的可用于数据传输的基本时隙分配给节点,当所有节点的需求都被满足,或所有的基本时隙都已经分配完,算法结束。本发明通过根据无线链路的距离,将所有的链路划分为K类,简化了协议设计与实现;每个链路的数据收发总时间,为某个基本时隙的整数倍;采用基本时隙的重分配方法,原本空闲不可用的基本时隙可被重分配给其他链路,提高了网络吞吐量,提升了协议效率。

    一种基于PER-IDQN的多无人机围捕战术方法

    公开(公告)号:CN114815891A

    公开(公告)日:2022-07-29

    申请号:CN202210525303.X

    申请日:2022-05-15

    Abstract: 本发明提供了一种基于PER‑IDQN的多无人机围捕战术方法,对栅格数字地图和无人机运动模型进行建模,通过各无人机与环境的交互,采用深度Q网络算法对多无人机神经网络模型进行部署,并利用优先经验回放策略对算法模型进行优化,然后构建状态空间、动作空间、奖励函数对多无人机围捕战术模型进行针对性设计,最后构建的多无人机围捕战术模型能够在复杂障碍物环境下制定的有效的围捕战术,实现对机动目标的包围捕获。本发明能够实现对机动目标的围捕,有效提升了对经验样本的采样效率,改善复杂任务场景下无人机决策模型训练速率较慢的问题,最终构建的多无人机围捕战术模型稳定性更强,能够适用于复杂动态环境下的多无人机围捕和自主避障任务。

    一种基于MADDPG的多无人机任务决策方法

    公开(公告)号:CN111880563B

    公开(公告)日:2022-07-15

    申请号:CN202010691504.8

    申请日:2020-07-17

    Abstract: 本发明公开了一种基于MADDPG的多无人机任务决策方法,将MADDPG算法引入到多无人机任务分配当中,首先根据多无人机实际作战环境,建立深度强化学习所需的二维作战环境模型,其次,建立多无人机作战环境中的防空导弹等多种威胁的数学描述,最后将多无人机的航迹、距离和战场的防御威胁作为约束条件,进行学习训练,进而得到多无人机任务决策模型。本方法采用了经验池和双网络结构,使得整个网络的运算与收敛速度大大提升,在无人机高速飞行的过程中,可以更快的得到结果,并且可以实现多无人机自主决策的目的,在未知的作战环境下也可以保证其任务决策的高效性。

    一种基于DDPG迁移学习的无人机机动目标跟踪方法

    公开(公告)号:CN111667513B

    公开(公告)日:2022-02-18

    申请号:CN202010486053.4

    申请日:2020-06-01

    Abstract: 本发明涉及一种基于DDPG迁移学习的无人机机动目标跟踪方法,通过对任务分解,初始化环境状态,神经网络参数等其他超参数,对神经网络进行训练。回合起始时,无人机执行行动改变速度和航向角,得到新的状态,并将每一回合的经验保存于经验池中作为学习样本,不断迭代更新神经网络的参数。当训练完成时,保存子任务训练好的神经网络参数,并迁移至下一任务场景下的无人机机动目标跟踪网络中,直到最终任务完成。

    自适应航速的水下航行器电池模组冷却系统

    公开(公告)号:CN113823859A

    公开(公告)日:2021-12-21

    申请号:CN202110999352.2

    申请日:2021-08-28

    Abstract: 为了对水下航行器的电池模组进行热管理,本发明提供了一种自适应航速的水下航行器电池模组冷却系统。本发明通过将外界海水引入到电池模组内部进行电源冷却,省去了航行器自带冷却剂的环节,减轻了航行器的重量;通过在冷却剂入口处设置用于调节冷却剂入口开口大小的引流调节阀,且该引流调节阀的开度与电池模组的输出功率呈正相关,且可以根据航速来自适应地调整阀芯开度,减少了寄生能量的损耗。

    一种基于深度强化学习的无人机机动决策方法

    公开(公告)号:CN113093802A

    公开(公告)日:2021-07-09

    申请号:CN202110364100.2

    申请日:2021-04-03

    Abstract: 本发明公开了一种基于深度强化学习的无人机机动决策方法,首先构建无人机机动模型,然后描述无人机和敌机作战相对态势,再依据马尔科夫过程构建状态空间、动作空间和奖惩函数,接下来构建SAC算法模型结构,再定义SAC算法模型参数并进行训练,最后初始化无人机和敌机作战态势,使用训练完成算法进行机动决策。本发明能够有效地令无人机自主决策,无需人工参与,且具有很强的探索能力,能够高效的探索到最优策略。

    一种基于迁移学习改进的PMADDPG多无人机任务决策方法

    公开(公告)号:CN111859541A

    公开(公告)日:2020-10-30

    申请号:CN202010691509.0

    申请日:2020-07-17

    Abstract: 本发明公开了一种基于迁移学习改进的PMADDPG多无人机任务决策方法。首先在多无人机实际作战环境背景下,针对环境中的防空导弹、雷达等威胁进行合理的数学建模,然后创建多个不同的二维作战环境模型,并且设计约束条件,依次对多个作战环境进行学习和训练,进而得到最终的多无人机任务分配模型。本发明方法克服了已有技术中只能在已知或静态作战环境下进行任务决策的缺陷,在未知的作战环境下,也可以能够高效的进行决策,实现无人机的任务,大大保障了无人机群在未知作战环境中的生存能力。

Patent Agency Ranking