-
公开(公告)号:CN118798253A
公开(公告)日:2024-10-18
申请号:CN202410776941.8
申请日:2024-06-17
Applicant: 大连海事大学
Abstract: 本发明是一种基于深度强化学习的多智能体逃逸方法,包括以下步骤:获取追方智能体和逃方智能体数量信息、物理尺寸信息、移动信息和追逃环境物理信息;构建追方智能体和逃方智能体各自生成两个演员网络和两个评论家网络分别命名为演员网络、演员网络的目标网络、评论家网络、评论家网络的目标网络;采用MADDPG对追方智能体和逃方智能体各自生成两个演员网络和两个评论家网络进行训练,得到逃方智能体逃脱追方智能体追捕的逃逸算法;追方智能体和逃方智能体的测试集数据,采用逃方智能体逃脱追方智能体追捕的逃逸算法进行测试,得到逃方智能体逃脱追方智能体逃脱任务的完成率,该方法提高多智能体在逃逸任务中的总体性能和效率。