-
公开(公告)号:CN117829317A
公开(公告)日:2024-04-05
申请号:CN202410015130.6
申请日:2024-01-04
Applicant: 桂林电子科技大学
IPC: G06N20/00 , G06F18/214 , G06N3/04 , G06N3/084
Abstract: 本发明公开一种基于个性化模型差异的个性化联邦学习方法,属于联邦学习技术领域,具体包括以下步骤:服务器发送全局模型给本地客户端,初始化化客户端模型;客户端根据本地数据进行模型训练,并上传模型参数给服务器;服务器根据这一轮客户端上传的参数进行生成模型差异矩阵;服务器依据客户端模型进行全局模型聚合,同时利用模型差异矩阵选择合适的邻居模型聚合并更新各个客户端的个性化模型;本地客户端根据服务端返回的模型更新本地模型。本发明能有效利用本地模型之间的差异加快个性化模型训练,有效提升个性化模型的精度。
-
公开(公告)号:CN118194905A
公开(公告)日:2024-06-14
申请号:CN202410014873.1
申请日:2024-01-04
Applicant: 桂林电子科技大学
Abstract: 本发明公开了一种基于协作谈判的多智能体强化学习方法,属于多智能体强化学习领域,包括对多智能体环境和策略建模,根据智能体的决策收益和当前环境进行协作谈判,利用谈判器生成最优策略,利用最优策略指导智能体长期协作,做出收益相对公平且促进群体最大化的决策行为。本发明中通过谈判器生成领导者的概率分布,依据概率分布选择出多智能体的领导者,然后其余智能体依据领导者的决策对当前环境进行最优策略选择,能够有效解决多智能体的决策冲突,同时有效减少智能体之间的收益差距,保证多智能体长期协作的公平性,促进了多智能体之间达成长期协作意愿,提高了多智能体系统的稳定性。
-