-
公开(公告)号:CN107832847A
公开(公告)日:2018-03-23
申请号:CN201711012694.0
申请日:2017-10-26
Applicant: 北京大学
IPC: G06N3/08
Abstract: 本发明公布了一种神经网络模型的稀疏化后向传播压缩方法,属于信息技术领域,涉及机器学习和深度学习技术。在后向传播过程中,神经网络模型的每层利用上一层的输出梯度作为输入计算梯度,进行k大值稀疏化处理,得到稀疏化处理后的向量和稀疏回传的次数,记录k个值对应的索引;利用稀疏化梯度对神经网络的参数进行更新;根据k大值下标索引,删除回传次数少的神经元,对模型进行压缩。本发明在后向传播过程中采用基于k大值的稀疏化方法,通过消除不活跃的神经元,压缩模型大小,提高深度神经网络的训练和推理速度,并保持良好的精度。