-
公开(公告)号:CN112947562B
公开(公告)日:2021-11-30
申请号:CN202110183956.X
申请日:2021-02-10
Applicant: 西北工业大学
IPC: G05D1/10
Abstract: 本发明公开了一种基于人工势场法和MADDPG的多无人机运动规划方法,该方法在原有多无人机探索环境经验的基础上,增加了通过人工势场法将多无人机成功规划至目标的高质量经验,在通过MADDPG算法训练时,以一定的概率分别从探索环境经验和高质量经验中采集样本,以每个无人机的自身状态信息和环境信息作为神经网络的输入,以多无人机的速度作为输出,完成运动规划策略的训练,实现多无人机在复杂环境下自主避障并安全快速地到达目标位置。本发明方法充分地学习到多无人机在不同状态和不同动作时的Q值,提高了策略的鲁棒性,训练出适应性更强和灵活性更高的优秀策略,在多无人机协同运动规划的场景中有很好的应用前景。
-
-
公开(公告)号:CN113341958A
公开(公告)日:2021-09-03
申请号:CN202110558854.1
申请日:2021-05-21
Applicant: 西北工业大学
IPC: G05D1/02
Abstract: 本发明公开了一种混合经验的多智能体强化学习运动规划方法,即ME‑MADDPG算法。该方法通过MADDPG算法训练,在产生样本时,不仅通过探索和学习产生经验,还增加了通过人工势场法将多无人机成功规划至目标的高质量经验,并把这两种经验存放至不同的经验池。在训练时,神经网络通过动态采样,以变化的概率从两种经验池中采集样本,以每个智能体的自身状态信息和环境信息作为神经网络的输入,以多智能体的速度作为输出。同时,在训练的过程中神经网络缓慢更新,稳定地完成多智能体运动规划策略的训练,最终实现多智能体在复杂环境下自主避障并顺利到达各自的目标位置。本发明可以在复杂动态的环境中高效地训练出稳定性和适应性更好的运动规划策略。
-
公开(公告)号:CN112947562A
公开(公告)日:2021-06-11
申请号:CN202110183956.X
申请日:2021-02-10
Applicant: 西北工业大学
IPC: G05D1/10
Abstract: 本发明公开了一种基于人工势场法和MADDPG的多无人机运动规划方法,该方法在原有多无人机探索环境经验的基础上,增加了通过人工势场法将多无人机成功规划至目标的高质量经验,在通过MADDPG算法训练时,以一定的概率分别从探索环境经验和高质量经验中采集样本,以每个无人机的自身状态信息和环境信息作为神经网络的输入,以多无人机的速度作为输出,完成运动规划策略的训练,实现多无人机在复杂环境下自主避障并安全快速地到达目标位置。本发明方法充分地学习到多无人机在不同状态和不同动作时的Q值,提高了策略的鲁棒性,训练出适应性更强和灵活性更高的优秀策略,在多无人机协同运动规划的场景中有很好的应用前景。
-
-
-