-
公开(公告)号:CN110633787A
公开(公告)日:2019-12-31
申请号:CN201910722230.1
申请日:2019-08-06
Applicant: 厦门大学
IPC: G06N3/04
Abstract: 基于多比特神经网络非线性量化的深度神经网络压缩方法,涉及深度神经网络的压缩。包括以下步骤:1)对预训练的模型权重进行非线性变换;2)设置量化比特位;3)计算每层的模型权重各自的尺度因子和偏置因子;4)通过上述计算出来的因子计算对应的量化权重。能够压缩经典的VGG-16和ResNet-50模型,在压缩模型达到5.4倍的情况下,模型的基本没有精度损失。量化后的模型可以直接嵌入到手机或移动设备端,大大加速负荷的原始模型的计算量和同时压缩高度冗余的原始模型的存储量,使得高性能深度学习模型植入移动嵌入式设备端,在移动智能识别、云计算及无人驾驶等领域存在大量的应用前景。