基于强化学习的自动化卷积神经网络量化剪枝方法、设备和存储介质

    公开(公告)号:CN115600650A

    公开(公告)日:2023-01-13

    申请号:CN202211363959.2

    申请日:2022-11-02

    Abstract: 本发明基于强化学习的自动化卷积神经网络量化剪枝方法,先获取图像的数据集,利用已初始化的模型对图像进行预训练,得到每个滤波器所输出特征图的平均秩,将平均秩结合滤波器的全局重要性排序,获得滤波器重要性信息;通过强化学习实现自动化神经网络模型量化与剪枝操作,获得模型精度最高的神经网络模型压缩策略,获取最终的剪枝完成以后的神经网络模型。本发明将卷积层中滤波器按照对模型精度影响的重要程度并结合平均秩大小进行全局排序,秩的大小与滤波器重要性大小具有一致性,同时对重要性高的滤波器权重参数分配较高bit位数,从而达到最大程度的精度保留,能将应用于高性能计算机上的神经网络压缩后部署于计算与存储较弱的移动边缘设备上。

Patent Agency Ranking