-
公开(公告)号:CN113255897A
公开(公告)日:2021-08-13
申请号:CN202110655204.9
申请日:2021-06-11
Applicant: 西安微电子技术研究所
Abstract: 本发明公开了一种卷积神经网络的池化计算单元,属于数字电路领域。本发明包括36个基本计算单元C0~C35和4个结果计算单元R0~R3;基本计算单元和所述结果计算单元均受表征池化类型的信号控制;当进行池化计算时,输入特征图像整行按顺序从输入端口输入,池化计算流水建立之后,池化计算单元按顺序每周期给出相应的输出图像数据;N个池化计算单元能够同时进行4N个池化尺寸为2x2或3x3的池化计算,或者N个池化尺寸为5x5的池化计算。本发明可根据池化计算的具体类型和尺寸灵活配置,增加了池化计算单元的可用性;该池化计算单元扩展简单,根据需求和系统开销灵活确定其计算并行度;输入图像数据复用大大减少了功耗。
-
公开(公告)号:CN113162906A
公开(公告)日:2021-07-23
申请号:CN202110218237.7
申请日:2021-02-26
Applicant: 西安微电子技术研究所
IPC: H04L29/06
Abstract: 本发明公开了一种NoC传输方法,本发明将包格式分为数据类包格式、请求类包格式和回复类包格式。任务传输协议将任务分为写传输和读传输。写传输协议又划分为带回复包写传输和不带回复包写传输。同时,定义了任务传输协议的包长度可配置。本发明既具有系统性、全面性,又有效提高了NoC传输效率,为不同应用场合下NoC传输协议定义提供有效的解决方案。
-
公开(公告)号:CN113312285B
公开(公告)日:2023-08-18
申请号:CN202110656789.6
申请日:2021-06-11
Applicant: 西安微电子技术研究所
IPC: G06F13/28 , G06N3/0464 , G06N3/08 , G06N3/063
Abstract: 本发明公开了一种卷积神经网络加速器及其工作方法,属于数字电路领域。本发明中的寄存器管理单元用于存储对卷积阵列的配置文件,当前卷积计算的各项参数信息,同时记录卷积阵列当前的运算状态,供主处理器查询;全局缓存模块用于对filter、ifmap和psum进行缓存;卷积阵列控制模块在接收到启动命令后根据寄存器管理单元提供的参数信息进行相应的数据交互操作,进行filter/ifmap和psum的传递;卷积阵列由大量PE单元级联而成,用于实现卷积运算;Pooling层用于进行池化计算;激活函数用于进行激活函数的计算。本发明克服了CNN卷积器的最大化输入数据重用和最小化Psum产生是无法同时实现的缺点。
-
公开(公告)号:CN113255897B
公开(公告)日:2023-07-07
申请号:CN202110655204.9
申请日:2021-06-11
Applicant: 西安微电子技术研究所
Abstract: 本发明公开了一种卷积神经网络的池化计算单元,属于数字电路领域。本发明包括36个基本计算单元C0~C35和4个结果计算单元R0~R3;基本计算单元和所述结果计算单元均受表征池化类型的信号控制;当进行池化计算时,输入特征图像整行按顺序从输入端口输入,池化计算流水建立之后,池化计算单元按顺序每周期给出相应的输出图像数据;N个池化计算单元能够同时进行4N个池化尺寸为2x2或3x3的池化计算,或者N个池化尺寸为5x5的池化计算。本发明可根据池化计算的具体类型和尺寸灵活配置,增加了池化计算单元的可用性;该池化计算单元扩展简单,根据需求和系统开销灵活确定其计算并行度;输入图像数据复用大大减少了功耗。
-
公开(公告)号:CN113162906B
公开(公告)日:2023-04-07
申请号:CN202110218237.7
申请日:2021-02-26
Applicant: 西安微电子技术研究所
Abstract: 本发明公开了一种NoC传输方法,本发明将包格式分为数据类包格式、请求类包格式和回复类包格式。任务传输协议将任务分为写传输和读传输。写传输协议又划分为带回复包写传输和不带回复包写传输。同时,定义了任务传输协议的包长度可配置。本发明既具有系统性、全面性,又有效提高了NoC传输效率,为不同应用场合下NoC传输协议定义提供有效的解决方案。
-
公开(公告)号:CN113312285A
公开(公告)日:2021-08-27
申请号:CN202110656789.6
申请日:2021-06-11
Applicant: 西安微电子技术研究所
Abstract: 本发明公开了一种卷积神经网络加速器及其工作方法,属于数字电路领域。本发明中的寄存器管理单元用于存储对卷积阵列的配置文件,当前卷积计算的各项参数信息,同时记录卷积阵列当前的运算状态,供主处理器查询;全局缓存模块用于对filter、ifmap和psum进行缓存;卷积阵列控制模块在接收到启动命令后根据寄存器管理单元提供的参数信息进行相应的数据交互操作,进行filter/ifmap和psum的传递;卷积阵列由大量PE单元级联而成,用于实现卷积运算;Pooling层用于进行池化计算;激活函数用于进行激活函数的计算。本发明克服了CNN卷积器的最大化输入数据重用和最小化Psum产生是无法同时实现的缺点。
-
-
-
-
-