-
公开(公告)号:CN116225016A
公开(公告)日:2023-06-06
申请号:CN202310205530.9
申请日:2023-03-06
Applicant: 东北大学
IPC: G05D1/02
Abstract: 本发明一种基于分布式协同深度强化学习模型的多智能体路径规划方法,通信领域与强化学习技术领域,包括以下步骤:对本发明设计的分布式协同深度强化学习模型进行训练,得到训练好的分布式协同深度强化学习模型,随机生成地图;基于训练好的的分布式协同深度强化学习模型,实现多智能体环境下的智能体在线路径规划。本发明的分布式协同深度强化学习方法,不同于集中式的深度强化学习方法,每个智能体只根据自身的观察做出决策,同时引入了智能体之间的通信和顺序决策,促进了智能体之间的协调。本方法从单个智能体的角度进行设计,不用考虑集体,从而避免了集中式深度强化学习的不可伸缩性问题。