一种深度神经网络训练方法、装置及电子设备

    公开(公告)号:CN118038388A

    公开(公告)日:2024-05-14

    申请号:CN202211369068.8

    申请日:2022-11-03

    Inventor: 张长水 宋玉海

    Abstract: 本申请公开了一种深度神经网络训练方法、装置及电子设备,该方法包括:分别对待训练神经网络和相对应的特征提取器进行预处理操作,其中,所述待训练神经网络对应有用于训练的训练数据集合,所述特征提取器用于提取所述训练数据集合中的样本的特征;基于预处理操作后的所述待训练神经网络和所述特征提取器,初始化包含所述训练数据集合中样本的特征的特征集合;基于所述样本以及所述特征集合,利用梯度下降法,逐批次更新所述待训练神经网络的网络参数,以对所述待训练神经网络进行训练。该方法能够对深度神经网络进行训练使其能够克服会存在过分自信的问题。即使对于训练数据集中的未出现的物体,深度神经网络亦会给出准确置信度的预测结果。

Patent Agency Ranking