一种非稳态多臂老虎机和概率夏普利值的联邦学习方法

    公开(公告)号:CN118445845A

    公开(公告)日:2024-08-06

    申请号:CN202410594687.X

    申请日:2024-05-14

    Applicant: 浙江大学

    Abstract: 本发明公开了一种非稳态多臂老虎机和概率夏普利值的联邦学习方法,该方法中,服务端根据当前超臂的概率分布,利用非稳态多臂老虎机模型抽取一个超臂;服务端利用截断蒙特卡洛算法,计算所选超臂中所有客户端的概率夏普利值并进行求和与归一化;服务端对受影响的每个超臂更新损失估计,并更新所有超臂的累积损失和概率;所选超臂中的每个客户端进行本地模型训练并将模型参数的变化上传至服务端;服务端基于收到的客户端模型参数的变化,结合所选超臂中所有客户端的概率夏普利值,计算全局模型参数的变化,从而更新全局模型参数并下发至各客户端;重复上述步骤,直至全局模型参数达到预定要求。

Patent Agency Ranking