-
公开(公告)号:CN119292342A
公开(公告)日:2025-01-10
申请号:CN202411654924.3
申请日:2024-11-19
Applicant: 浙江大学
IPC: G05D1/695 , G05D109/20
Abstract: 本发明公开了一种基于深度多智能体强化学习的无人机集群协同搜索方法及系统,包括:定义追踪者无人机、侦察者无人机和智能目标无人机;为每个无人机智能体初始化行动者网络、评论家网络和经验回放缓冲区;每个无人机智能体根据当前状态,通过其行动者网络选择动作并执行,当环境返回新的状态和对应的奖励后,将交互经验存储到经验回放缓冲区;从经验回放缓冲区中随机抽取一批经验样本,更新评论家网络;使用评论家网络来计算梯度,根据这些梯度更新每个智能体的行动者网络;持续进行智能体的交互、数据收集、网络训练和目标网络更新,直至达到一定的训练周期或性能标准。本发明可以提高无人机集群在复杂环境中执行协同搜索任务的效率和安全性。