多方联合进行蒸馏训练的方法及装置

    公开(公告)号:CN117436508A

    公开(公告)日:2024-01-23

    申请号:CN202311297269.6

    申请日:2023-10-08

    Abstract: 本说明书实施例提供了的多方联合进行蒸馏训练的方法及装置,该方法的一具体实施方式包括:获取上一轮更新后的学生模型针对验证集的标签预测损失对应的标签梯度;利用该学生模型,针对该训练集得到第一预测输出;根据目标方上的教师模型针对训练集的第二预测输出、该第一预测输出以及历史训练信息,确定目标方在第t轮的第一信息,目标方为任意第一方;根据该梯度和目标方在第t轮的第一信息,确定目标方在第t轮的贡献参数。当在保护隐私的多方联合蒸馏训练中评估教师模型的提供方的贡献时,仅需进行常规的蒸馏训练,无需进行额外的蒸馏训练,评估教师模型贡献度的计算成本得到极大降低。

Patent Agency Ranking