结构化细粒度的二值网络双剪枝方法及稀疏加速器架构

    公开(公告)号:CN115438774A

    公开(公告)日:2022-12-06

    申请号:CN202211070620.3

    申请日:2022-08-31

    Inventor: 齐志 付克琦 刘昊

    Abstract: 本发明公开一种结构化细粒度的二值网络双剪枝方法及稀疏加速器架构,不仅在保护精度的同时有效降低BNN的模型参数量与计算量,而且提供易于硬件实现的并行性。该方法对每组卷积权重沿通道方向做N选一的结构化裁剪,在网络各层输出特征图平面内跳过非重要值所参与的卷积计算。一方面,训练过程中生成控制通道裁剪的索引张量与控制特征图裁剪的平面掩膜,既尽力保护二值网路的精度,也实现二值网络的大幅度精简。另一方面,权重沿通道方向N选一的结构化裁剪与特征图平面掩膜裁剪对硬件友好,只需添加N选一的MUX以及与单层输出特征图尺寸匹配的FIFO即可在任意二值网络加速器中嵌套裁剪后稀疏二值网络的映射,在硬件中充分发挥双重裁剪带来的能效收益。

Patent Agency Ranking