用于减少深度学习网络的权重存储位的系统和方法

    公开(公告)号:CN108288087B

    公开(公告)日:2023-07-18

    申请号:CN201810019776.6

    申请日:2018-01-09

    Abstract: 一种用于减少深度学习网络的权重存储位的系统和方法,所述系统包括量化模块和簇数减少模块。量化模块对深度学习网络的每一个量化层的神经权重进行量化。簇数减少模块减少具有作为所述多个量化层的聚类误差的最小值的聚类误差的层的簇的预定数量。量化模块基于所述层的簇的减少的预定数量对所述层进行重新量化,簇数减少模块还确定具有作为所述多个量化的层的聚类误差的最小值的聚类误差的另一个层,并减少另一个层的簇的预定数量,直到深度学习网络的识别性能已降低预定阈值为止。

    优化的神经网络输入步长方法及设备

    公开(公告)号:CN108875908A

    公开(公告)日:2018-11-23

    申请号:CN201810466274.8

    申请日:2018-05-16

    Abstract: 公开一种优化的神经网络输入步长的方法及设备。在形成卷积层的硬件使用1的输入步长进行操作时,卷积神经网络中的卷积层使用大于1的预定水平输入步长和预定垂直输入步长。基于预定水平输入步长和预定垂直输入步长来对多组原始权重内核中的每个原始权重内核进行细分,以针对每组原始权重内核形成一组多个子内核。基于预定水平输入步长和预定垂直输入步长来对多个IFM中的每个IFM进行细分以形成多个子图。使用1的水平输入步长通过针对一组原始权重内核的对应的子内核来对每个子图进行卷积。对每个子图和对应的子内核的卷积结果进行求和以形成输出特征图。

    用于减少深度学习网络的权重存储位的系统和方法

    公开(公告)号:CN108288087A

    公开(公告)日:2018-07-17

    申请号:CN201810019776.6

    申请日:2018-01-09

    CPC classification number: G06N3/08 G06N3/0454 G06N3/063 G06K9/6223

    Abstract: 一种用于减少深度学习网络的权重存储位的系统和方法,所述系统包括量化模块和簇数减少模块。量化模块对深度学习网络的每一个量化层的神经权重进行量化。簇数减少模块减少具有作为所述多个量化层的聚类误差的最小值的聚类误差的层的簇的预定数量。量化模块基于所述层的簇的减少的预定数量对所述层进行重新量化,簇数减少模块还确定具有作为所述多个量化的层的聚类误差的最小值的聚类误差的另一个层,并减少另一个层的簇的预定数量,直到深度学习网络的识别性能已降低预定阈值为止。

Patent Agency Ranking