-
公开(公告)号:CN117273116A
公开(公告)日:2023-12-22
申请号:CN202210663455.6
申请日:2022-06-13
Applicant: 华为云计算技术有限公司
IPC: G06N3/0895 , G06N3/10
Abstract: 本申请提供了一种模型训练方法,包括:获取原始数据及待训练的特征提取网络模型;根据该原始数据,生成扩增样本以及掩码样本,扩增样本通过对原始数据进行扩增得到,掩码样本通过在原始数据中添加掩码得到,从而利用扩增样本对特征提取网络模型进行自监督的对比式学习,并利用掩码样本对特征提取网络模型进行自监督的生成式学习,即可得到目标模型。如此,不仅可以有效减少训练特征网络提起模型所需的人力成本、提高模型训练的整体效率。而且,通过结合生成式学习以及对比式学习,能够提取出训练样本内的上下文依赖关系以及重要的区分性特征,从而可以提高目标模型提取特征的准确性。此外,本申请还提供了对应的装置、设备及存储介质。