面向非独立同分布数据的强化学习辅助联邦学习方法

    公开(公告)号:CN119358640A

    公开(公告)日:2025-01-24

    申请号:CN202411429779.9

    申请日:2024-10-14

    Abstract: 本发明提供了一种面向非独立同分布数据的强化学习辅助联邦学习方法,属于强化学习以及联邦学习技术领域。该方法首先获得客户端的初始全局模型权重,然后对初始全局模型权重采用随机梯度下降算法进行训练,将训练好的各客户端模型权重发送给联邦学习服务器,对联邦学习服务器本地拷贝的模型权重信息进行更新;强化学习agent通过联邦学习服务器传来的状态,为所有登记过的客户端计算客户端各自的预测值;并通过在优先级经验回放缓冲区中抽取固定数量大小的样本来训练Q网络得到Q值;通过Q值选择下一轮参与训练的K个客户端进行训练;直到训练联邦学习服务器得到全局模型权重的准确率等于目标准确率或者达到设置的最大轮数。

Patent Agency Ranking