-
公开(公告)号:CN117391162A
公开(公告)日:2024-01-12
申请号:CN202311232557.3
申请日:2023-09-22
Applicant: 南京大学
IPC: G06N3/063 , G06N3/0464 , G06F7/50
Abstract: 本申请提供一种基于卷积神经网络的加速器及加速方法,加速器包括:编译器、获取单元、片上储存器、计算单元;通过将片上储存器分为缓存模式和储存模式,在缓存模式时,片上储存器被分为多层缓存区,输入特征图逐行写入当前缓存区内,将得到的中间特征图和输入特征图输入下一层缓存区;在储存模式时,片上储存器被分为两个储存区,将输入特征图写入一个存储区中,将得到的中间特征图写入另一个存储区中,在两个储存区内交替计算。再根据编译器解析ONNX模型,可通过ONNX模型中的算子组对输入特征图分类,以为输入特征图选择片上储存器不同的运行模式,减少运算过程中数据的重复搬运,以解决卷积神经网络硬件加速器计算效率低的问题。