多任务神经网络的训练方法、装置、计算设备及存储介质

    公开(公告)号:CN114332558A

    公开(公告)日:2022-04-12

    申请号:CN202111533167.0

    申请日:2021-12-15

    Abstract: 本发明公开一种多任务神经网络的训练方法、装置、计算设备及存储介质,该方法包括:获取训练数据集,并且对于每个任务随机采集训练数据集中一定数量的图片进行标注;对训练数据集中的图片进行预处理,若图片具有所有任务的标签,采用第一方式得到第一图片,反之采用第一方式和第二方式得到第一图片和第二图片;对于每一任务,如果图片具有该任务的标签,则采用交叉熵方法计算该任务的损失函数,反之则计算对应的第一图片和第二图片在该任务上的KL散度值作为损失函数;根据所有损失函数计算梯度值,并根据梯度值调整预设的多任务神经网络模型。根据本发明实施例可以大大减少训练阶段人力成本和时间成本的投入,提升模型对于多任务的预测泛化能力。

    一种神经网络训练方法、装置、设备及存储介质

    公开(公告)号:CN114372560A

    公开(公告)日:2022-04-19

    申请号:CN202111650469.6

    申请日:2021-12-30

    Abstract: 本发明提出了一种神经网络训练方法、装置、设备及存储介质,该方法包括:获取步骤,获取用于神经网络训练的样本集,所述样本集包括多个不同类别的图片;优化步骤,优化现有的神经网络模型损失函数,减小每个神经元由于分类样本不均衡导致的梯度方向偏差;训练步骤,使用优化后的损失函数对所述神经网络使用所述样本集进行训练得到训练好的神经网络模型。本发明通过对损失函数进行优化,从而减小由于分类样本不均衡导致的梯度方向偏差,减小的含义是,在同样的样本集经过同样的训练次数后,梯度方向的偏差相比现有方案更小,其可以解决由于现有损失函数导致的缺陷。

Patent Agency Ranking