一种基于TD3的无人机集群避障策略生成方法

    公开(公告)号:CN119440056A

    公开(公告)日:2025-02-14

    申请号:CN202411571175.8

    申请日:2024-11-06

    Abstract: 本发明提出了一种基于双延迟深度确定性策略梯度(TD3)的无人机集群避障策略生成方法。该方法通过结合任务需求、环境条件和无人机性能参数,构建马尔可夫决策模型,包括状态空间、动作空间和奖励函数,并通过TD3算法对模型进行训练。首先,确定无人机集群的目标运动方向和密度,并设定最小安全间距和障碍距离,以确保飞行安全;然后,定义奖励函数,引导无人机在复杂环境中实现有效的避障和队形保持。与传统的规则驱动和经典算法(如几何路径规划、人工势场法)相比,基于TD3的方案具备更强的自适应能力和灵活性,能够在动态环境中快速调整策略,避免陷入局部最优。此外,TD3算法通过延迟策略更新和经验回放,提升了策略的稳定性和收敛性,使无人机集群在高密度场景下保持实时避障和队形稳定。实验结果显示,该方法在模拟环境中能够有效避开障碍物,维持预设队形,并减少能量消耗,证明了其在无人机集群协同任务中的应用潜力。本发明适用于军事、物流配送、环境监测等领域的多无人机集群任务,可显著提升任务执行效率和安全性。

Patent Agency Ranking