-
公开(公告)号:CN117422153A
公开(公告)日:2024-01-19
申请号:CN202311555214.0
申请日:2023-11-21
Applicant: 桂林电子科技大学
Abstract: 本发明公开了一种基于观察交互的多智能体协调方法,涉及多智能体强化学习技术领域,包括以下步骤:S1:观察信息交互:同时存在多个智能体与环境交互时,每个智能体将其获得的局部观察结果和最后的操作作为输入,输入到MAIT中,通过MAIT进行观察信息交互;S2:观察动作建模:智能体交互后的观察与智能体动作建立联系,选出当前环境状态下最优动作,采用MAIT中的多头注意力机制确定重要性权重,完成观察与动作之间的建模;S3:决策优化:通过将智能体局部观察进行优化,优化观察与动作之间的建模,实现智能体决策网络的优化。本发明采用上述方法利用交互网络交互每个智能体局部观察,加深智能体在有限设定中对全局环境的观察,提升多智能体间的协作能力。