-
公开(公告)号:CN107437110A
公开(公告)日:2017-12-05
申请号:CN201710560643.5
申请日:2017-07-11
Applicant: 中国科学院自动化研究所
CPC classification number: G06N3/082 , G06N3/0454 , G06N3/063
Abstract: 本发明涉及深度神经网络领域,提出了一种卷积神经网络的分块卷积优化方法及装置,旨在解决神经网络中卷积运算在硬件处理系统中的处理瓶颈问题,该优化方法包括:选择待分块卷积的卷积层,并确定其分块尺寸上限;根据分块尺寸的上限,确定输入特征图的分块数、分块尺寸;基于分块数、分块尺寸、卷积核尺寸、输入特征图尺寸、输入特征图边界填充尺寸,计算分块特征图的分块边界填充尺寸;基于分块数、分块尺寸、分块边界填充尺寸,构建基于分块边界填充的卷积,并替换原始卷积。本发明大大缓解了卷积神经网络在嵌入式硬件平台运行的资源受限问题,并在读写存储器时最大限度的提高突发长度,提高吞吐量,降低延时,提高效率。
-
公开(公告)号:CN107437110B
公开(公告)日:2021-04-02
申请号:CN201710560643.5
申请日:2017-07-11
Applicant: 中国科学院自动化研究所
Abstract: 本发明涉及深度神经网络领域,提出了一种卷积神经网络的分块卷积优化方法及装置,旨在解决神经网络中卷积运算在硬件处理系统中的处理瓶颈问题,该优化方法包括:选择待分块卷积的卷积层,并确定其分块尺寸上限;根据分块尺寸的上限,确定输入特征图的分块数、分块尺寸;基于分块数、分块尺寸、卷积核尺寸、输入特征图尺寸、输入特征图边界填充尺寸,计算分块特征图的分块边界填充尺寸;基于分块数、分块尺寸、分块边界填充尺寸,构建基于分块边界填充的卷积,并替换原始卷积。本发明大大缓解了卷积神经网络在嵌入式硬件平台运行的资源受限问题,并在读写存储器时最大限度的提高突发长度,提高吞吐量,降低延时,提高效率。
-