-
公开(公告)号:CN118982719A
公开(公告)日:2024-11-19
申请号:CN202411121102.9
申请日:2024-08-15
Applicant: 中国科学院计算技术研究所
IPC: G06V10/764 , G06V10/774 , G06V10/82
Abstract: 本发明提供了一种用于训练图像分类模型的方法,包括:获取当前批次的样本,该批次的样本构成的集合具有长尾分布的性质;将当前批次的样本图像输入模型,利用模型参数确定输入图像的第一分类预测值,根据第一分类预测值、标签和总损失函数确定第一梯度,总损失函数为原始损失函数减去加权系数乘以锐度优化损失函数;根据当前批次中属于每个类别的样本图像对应的第一分类预测值和标签,确定模型参数对应的扰动;将模型参数与扰动相加,得到扰动参数;将当前批次的样本图像输入模型,利用模型的扰动参数确定输入图像的第二分类预测值,根据第二分类预测值、标签和锐度优化损失函数,确定第二梯度;根据第一梯度和第二梯度,更新所述模型参数。