一种基于强化学习的动态公平联邦学习方法及装置

    公开(公告)号:CN117273119B

    公开(公告)日:2024-09-13

    申请号:CN202311076328.7

    申请日:2023-08-24

    Abstract: 本发明提供一种基于强化学习的动态公平联邦学习方法及装置,在一轮联邦训练中,各客户端根据各自的本地数据对服务器下发的模型进行训练,生成本地模型,并计算本地模型的本地训练损失;将本地模型、本地训练损失和本地数据规模上传至服务器进行聚合;在聚合阶段,将本地训练损失作为强化学习状态输入,根据状态及当前策略选择执行动作,根据执行动作和本地规模占比计算聚合权重,基于聚合权重完成该轮联邦聚合;根据当前全局联邦模型准确率设置奖励值,以优化强化学习;重复多轮联邦训练,直至得到最终全局联邦模型。本发明提供的方法能够在保护隐私和较小通信开销基础上,将各本地训练损失作为公平性度量,优化联邦聚合过程,实现公平联邦学习。

    一种基于强化学习的动态公平联邦学习方法及装置

    公开(公告)号:CN117273119A

    公开(公告)日:2023-12-22

    申请号:CN202311076328.7

    申请日:2023-08-24

    Abstract: 本发明提供一种基于强化学习的动态公平联邦学习方法及装置,在一轮联邦训练中,各客户端根据各自的本地数据对服务器下发的模型进行训练,生成本地模型,并计算本地模型的本地训练损失;将本地模型、本地训练损失和本地数据规模上传至服务器进行聚合;在聚合阶段,将本地训练损失作为强化学习状态输入,根据状态及当前策略选择执行动作,根据执行动作和本地规模占比计算聚合权重,基于聚合权重完成该轮联邦聚合;根据当前全局联邦模型准确率设置奖励值,以优化强化学习;重复多轮联邦训练,直至得到最终全局联邦模型。本发明提供的方法能够在保护隐私和较小通信开销基础上,将各本地训练损失作为公平性度量,优化联邦聚合过程,实现公平联邦学习。

Patent Agency Ranking