一种卷积神经网络卷积层的硬件加速方法、系统及应用

    公开(公告)号:CN115238863A

    公开(公告)日:2022-10-25

    申请号:CN202210847824.7

    申请日:2022-07-19

    Inventor: 张国和 陈盼盼

    Abstract: 一种卷积神经网络卷积层的硬件加速方法、系统及应用,方法包括以下步骤:将浮点数转化成定点数并输入到FPGA中进行计算;采用基于移位寄存器的小尺寸卷积方法以及深度可分离卷积结构降低计算复杂度;数据流采用行固定流阵列结构,将卷积层前后的其他层进行隐藏处理;将批量归一化层、激活函数层以及填充层均嵌入卷积层中隐藏,完成硬件加速。本发明还提出一种卷积神经网络卷积层的硬件加速系统以及所述卷积神经网络卷积层的硬件加速方法在MobileNet模型、YOLOv2模型FPGA卷积硬件加速器中的应用。本发明卷积神经网络卷积层的硬件加速方法在资源占用、功耗、单位帧率以及能耗比方面均具有优势。

Patent Agency Ranking