-
公开(公告)号:CN112465151A
公开(公告)日:2021-03-09
申请号:CN202011490926.5
申请日:2020-12-17
Applicant: 电子科技大学长三角研究院(衢州)
Abstract: 本发明公开了一种基于深度强化学习的多智能体联邦协作方法,包括以下步骤:S1、对每个智能体建立深度强化学习模型;S2、为智能体建立对应的神经网络;S3、智能体与环境进行交互,将决策经验存储到经验池中,并且根据随机梯度下降法更新本地的神经网络模型;S4、将本地的神经网络模型参数传给协作平台;S5、对智能体上传的参数进行聚合处理,并将结果返回给各个智能体进行参数更新;S6、智能体进行软更新,得到最新的本地模型参数;S7、重复S3‑S6,直到完成目标任务。本发明的智能体在通过深度强化学习进行环境探索与决策的同时,利用联邦学习技术获取其他智能体学习经验,从而有效地提高智能体学习效率,且降低智能体之间的协作开销。