基于梯度方差减小和数据重排的模型训练方法

    公开(公告)号:CN118863099B

    公开(公告)日:2025-01-03

    申请号:CN202411340664.2

    申请日:2024-09-25

    Abstract: 本申请公开了基于梯度方差减小和数据重排的模型训练方法,涉及计算机技术领域,方法包括:获取待训练模型对应的初始的模型参数及样本序列;在迭代周期开始时,对样本序列进行重排;在当前迭代周期,确定样本序列中样本在当前迭代周期开始时的样本平均梯度;依次选取目标样本,确定目标样本在当前模型参数下的样本当前梯度,根据样本平均梯度调整样本当前梯度获得样本调整梯度,根据样本调整梯度更新模型参数;若样本遍历完毕,则进入下一个迭代周期并返回执行对样本序列进行重排的步骤,直至满足预设的训练终止条件并获得训练完成时的模型参数。如此,能提高模型训练的收敛速度、训练速率和训练效果。

    基于梯度方差减小和数据重排的模型训练方法

    公开(公告)号:CN118863099A

    公开(公告)日:2024-10-29

    申请号:CN202411340664.2

    申请日:2024-09-25

    Abstract: 本申请公开了基于梯度方差减小和数据重排的模型训练方法,涉及计算机技术领域,方法包括:获取待训练模型对应的初始的模型参数及样本序列;在迭代周期开始时,对样本序列进行重排;在当前迭代周期,确定样本序列中样本在当前迭代周期开始时的样本平均梯度;依次选取目标样本,确定目标样本在当前模型参数下的样本当前梯度,根据样本平均梯度调整样本当前梯度获得样本调整梯度,根据样本调整梯度更新模型参数;若样本遍历完毕,则进入下一个迭代周期并返回执行对样本序列进行重排的步骤,直至满足预设的训练终止条件并获得训练完成时的模型参数。如此,能提高模型训练的收敛速度、训练速率和训练效果。

Patent Agency Ranking