-
公开(公告)号:CN117171554A
公开(公告)日:2023-12-05
申请号:CN202210571345.7
申请日:2022-05-24
Applicant: 华为云计算技术有限公司
IPC: G06F18/214 , G06N3/0455 , G06N3/088 , G06N3/096 , G06F40/242 , G06F40/216
Abstract: 本申请提供了一种模型训练方法,包括:获取第一基础模型的特征向量层参数,以及获取对齐矩阵,该第一基础模型为利用第一训练集预训练好的基础模型,然后根据第一基础模型的特征向量层参数和对齐矩阵,对第二基础模型的特征向量层参数进行初始化,接着利用第二训练集训练初始化后的第二基础模型。该方法通过对齐矩阵将第一基础模型的特征向量层参数迁移学习至第二基础模型的特征向量层进行初始化,由此可以加快训练进度,提高训练效率,提升训练效果。