-
公开(公告)号:CN116736884A
公开(公告)日:2023-09-12
申请号:CN202310700522.1
申请日:2023-06-14
Applicant: 湖南大学
IPC: G05D1/10 , G06N3/0455 , G06N3/045 , G06N3/0499 , G06N3/08 , G06N7/01
Abstract: 本申请提供一种基于深度强化学习的多无人机协同围捕方法,针对围捕过程中的运动模型设计了一种围捕奖励函数,通过多种奖励相结合的方式,使得多无人机合作围捕具有较高的成功率。此外,本发明设计了一种多无人机协同围捕神经网络,通过自适应的方式对友无人机的动态联合策略进行显式建模,围捕无人机能够根据友无人机策略进行自适应的调整自身的动作,提高经验的利用率的同时也加快网络训练过程中的收敛速度,与此同时,为了确保经验数据原有的表达能力,减少训练的复杂度,对协同围捕的神经网络进行了优化,将编码器线性层作为前馈神经网络;优化后的神经网络适用于静态围捕目标的同时,也对动态围捕目标具有很好的效果,具有良好的环境适应性。