-
公开(公告)号:CN111782356B
公开(公告)日:2022-04-08
申请号:CN202010496091.8
申请日:2020-06-03
Applicant: 上海交通大学
Abstract: 本发明提供了一种权重稀疏神经网络芯片的数据流方法及系统,包括:步骤S1:针对卷积核稀疏度随输入变化的特点,设计适应稀疏度变化的串行计算的内层循环方案;步骤S2:针对卷积核稀疏度不同可能导致的计算单元间不同步的问题,设计并行计算的方案;步骤S3:为优化输入及输出缓存,设计串行计算的外层循环方案。本发明解决了卷积核稀疏度不同导致的部分硬件资源闲置的问题以及不同计算单元计算的卷积核稀疏度不同导致的计算单元间的同步问题。
-
公开(公告)号:CN111782356A
公开(公告)日:2020-10-16
申请号:CN202010496091.8
申请日:2020-06-03
Applicant: 上海交通大学
Abstract: 本发明提供了一种权重稀疏神经网络芯片的数据流方法及系统,包括:步骤S1:针对卷积核稀疏度随输入变化的特点,设计适应稀疏度变化的串行计算的内层循环方案;步骤S2:针对卷积核稀疏度不同可能导致的计算单元间不同步的问题,设计并行计算的方案;步骤S3:为优化输入及输出缓存,设计串行计算的外层循环方案。本发明解决了卷积核稀疏度不同导致的部分硬件资源闲置的问题以及不同计算单元计算的卷积核稀疏度不同导致的计算单元间的同步问题。
-
公开(公告)号:CN108389183A
公开(公告)日:2018-08-10
申请号:CN201810070005.X
申请日:2018-01-24
Applicant: 上海交通大学
CPC classification number: G06T7/0012 , G06N3/0454 , G06N3/0481 , G06N3/08 , G06T2207/30064
Abstract: 本发明提供了一种肺部结节检测神经网络加速器及其控制方法,输入数据通过控制模块进入FIFO模块,然后进入卷积模块完成卷积中的乘累加运算,乘累加运算后进入累加模块累加中间值,累加中间值后进入激活函数模块进行激活函数,激活函数后进入降采样模块进行均值池化,均值池化后进入光栅化模块进行光栅化,将输出转化为一维向量返回控制模块;控制模块调用并配置FIFO模块、卷积模块、累加模块、激活函数模块、降采样模块和光栅化模块控制迭代,以及将迭代结果传输至全连接层进行乘累加运算和概率比较。本发明通过控制模块针对该肺部结节检测网络优化了迭代控制逻辑,以节省资源消耗,增加数据吞吐率。
-
-