-
公开(公告)号:CN113657595A
公开(公告)日:2021-11-16
申请号:CN202110960966.X
申请日:2021-08-20
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出一种基于硬件的神经网络实时剪枝方法、系统及神经网络加速器,包括获取神经网络模型中待矩阵乘的比特矩阵,并以比特矩阵比特行与比特列的欧氏距离乘积,作为该比特矩阵中各比特行在矩阵乘运算中的重要度;根据该重要度将比特矩阵的每个比特行划分位重要行或非重要行,并将该比特矩阵的非重要行中为1的比特位置零后得到的矩阵,作为该比特矩阵的剪枝结果。本发明为基于有效bit的剪枝方法,且本申请判断bit有效度的方法无需借助软件层面进行剪枝、独立于现有软件剪枝方法并且支持多精度DNN。
-
公开(公告)号:CN113657595B
公开(公告)日:2024-03-12
申请号:CN202110960966.X
申请日:2021-08-20
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出一种基于硬件的神经网络实时剪枝方法、系统及神经网络加速器,包括获取神经网络模型中待矩阵乘的比特矩阵,并以比特矩阵比特行与比特列的欧氏距离乘积,作为该比特矩阵中各比特行在矩阵乘运算中的重要度;根据该重要度将比特矩阵的每个比特行划分位重要行或非重要行,并将该比特矩阵的非重要行中为1的比特位置零后得到的矩阵,作为该比特矩阵的剪枝结果。本发明为基于有效bit的剪枝方法,且本申请判断bit有效度的方法无需借助软件层面进行剪枝、独立于现有软件剪枝方法并且支持多精度DNN。
-