模型微调方法、装置、计算机设备及存储介质

    公开(公告)号:CN119514718A

    公开(公告)日:2025-02-25

    申请号:CN202411362978.2

    申请日:2024-09-27

    Abstract: 本公开提出一种模型微调方法、装置、计算机设备及存储介质,该方法包括:加载客户端中的预训练模型和模型微调模块,以使模型微调模块生成预训练模型的第一矩阵和第二矩阵;第一矩阵的元素是从随机高斯分布中抽取得到的;第二矩阵的元素均为零;通过本地数据集对预训练模型进行模型训练得到第一模型,多个客户端的本地数据集各不相同;接收至少一个第三矩阵,其中,每个第三矩阵是由一个相邻客户端发来的,每个第三矩阵是一个相邻客户端通过预设优化算法对第二矩阵进行更新得到的;基于第一模型以及至少一个第三矩阵生成第二模型。本公开实施例能够降低共识误差,进而大大提高模型性能,并且能够显著减少模型更新过程中所需的通信量。

Patent Agency Ranking