一种支持脉动阵列进行卷积神经网络模型训练的数据重组方法

    公开(公告)号:CN115375973A

    公开(公告)日:2022-11-22

    申请号:CN202211038910.X

    申请日:2022-08-29

    Abstract: 一种支持脉动阵列进行卷积神经网络模型训练的数据重组方法,属于深度神经网络模型训练技术领域。本发明包括如下步骤:步骤1,正向卷积计算:输入和输出特征图遵循通道优先格式,卷积核遵循卷积核个数优先格式;步骤2,反向计算残差:以步骤1输出特征图的残差作为输入特征图,以步骤1中的卷积核作为卷积核;输入和输出特征图遵循通道优先格式,卷积核遵循卷积核个数优先格式;步骤3,反向计算权重:以步骤1的输入特征图作为输入特征图,以步骤1输出特征图的残差作为卷积核;输入和输出特征图遵循通道优先格式,卷积核遵循通道优先格式。本发明能够提高数据的空间局部性,省去了计算中数排布转换的需求,提升计算效率。

    一种高效的矩阵乘运算加速装置及方法

    公开(公告)号:CN115357854A

    公开(公告)日:2022-11-18

    申请号:CN202211045832.6

    申请日:2022-08-30

    Abstract: 本发明涉及机器学习技术领域,具体涉及一种高效的矩阵乘运算加速装置及方法,包括矩阵乘法加速单元、北向数据加载器、西向数据整形与加载器、累加缓冲器、累加结果写回控制器和本地局部存储器,矩阵乘法加速单元包括呈二维脉动阵列排列的矩阵乘法加速核心,矩阵乘法加速单元通过北向数据加载器从本地局部存储器获取北向数据,西向数据整形与加载器从本地局部存储器获取西向数据并整形,矩阵乘法加速核心的运算单元进行乘加运算,乘加结果输入至累加缓冲器,全部运算结束后,累加结果写回本地局部存储器。本发明的有益技术性效果包括:北向数据可以预加载,掩盖延迟;2)固定北向数据,增加数据重用性;3)减少数据流动,降低功耗。

    多深度缓冲激活重发方法及装置

    公开(公告)号:CN113900816B

    公开(公告)日:2024-03-22

    申请号:CN202111201772.8

    申请日:2021-10-15

    Abstract: 本发明实施例提供一种多深度缓冲激活重发方法及装置,所述方法包括:高速缓冲存储器接收到访存请求,获取访存请求的请求地址,根据请求地址判断访存请求是否命中;未命中则发送访存请求进入脱靶缓冲,并设置第一重发标识位;高速缓冲存储器接收到后续未命中请求时,获取后续未命中请求后续地址,与请求地址进行地址相关性判断;当不相关时,发送后续未命中请求进入脱靶缓冲,设置第二重发标识位;检测到脱靶缓冲中的访存请求和后续未命中请求完成从主存装载后,通过激活重发步骤,对脱靶缓冲中的访存请求进行重发。采用本方法能够支持访存请求的乱序发射和乱序完成,同时保证脱靶请求重发后的正确性,从而提高数据Cache的性能和效率。

    一种超长点数高性能FFT计算装置

    公开(公告)号:CN112163187B

    公开(公告)日:2023-07-07

    申请号:CN202011290004.X

    申请日:2020-11-18

    Abstract: 本发明涉及数字信号处理领域,具体涉及一种超长点数超高性能FFT计算装置。本发明通过以下技术方案得以实现的:一种超长点数超高性能FFT计算装置,包含FFT计算模块和控制单元,所述FFT计算模块数量为两个,分别为计算模块一和计算模块二;还包含两个三维转置存储器和二维转置存储器;三维转置存储器一的数据输入端连接主存,数据输出端连接计算模块一;所述二维转置存储器的数据输入端连接所述计算模块一,数据输出端连接所述计算模块二。本发明的目的是提供一种超长点数超高性能FFT计算装置,通过全新的数据转置处理方式,增加数据平滑性,使得FFT数据处理过程中数据带宽利用率高,大大增加处理效率。

    一种矩阵乘运算装置及其低开销异常定位方法

    公开(公告)号:CN115470450A

    公开(公告)日:2022-12-13

    申请号:CN202211046721.7

    申请日:2022-08-30

    Abstract: 本发明涉及人工智能技术领域,具体涉及一种矩阵乘运算装置及其低开销异常定位方法,包括呈矩阵排列的运算核心、北向数据加载器、西向数据整形与加载器、累加缓冲器、累加结果写回控制器、异常检测控制器和本地局部存储器,异常检测控制器与南侧一行及东侧一列运算核心连接,运算核心包括乘法器、加法器、累加数据寄存器和异常寄存器,乘法器接收北向数据和西向数据,乘法器计算北向数据和西向数据的乘积,加法器与乘法器及累加数据寄存器连接,加法器计算乘法器输出值与累加数据寄存器值的和,并输出到南侧的运算核心的累加数据寄存器,异常寄存器与乘法器及加法器连接。本发明的有益技术效果包括:能够及时排查异常情况,提高异常排除效率。

    一种累加器缓冲的数据累加卸载系统及方法

    公开(公告)号:CN115268837A

    公开(公告)日:2022-11-01

    申请号:CN202210966710.4

    申请日:2022-08-12

    Abstract: 本发明涉及累加器缓冲技术领域,具体为一种累加器缓冲的数据累加卸载系统及方法。一种累加器缓冲的数据累加卸载系统,包括一累加器缓冲控制逻辑和多个累加器缓冲模块;每一所述累加器缓冲模块均包括一控制寄存器,与所述累加器缓冲控制逻辑电性连接,用于接收并暂存所述累加器缓冲控制逻辑发出的控制信号;一数据累加卸载子模块,与所述控制寄存器电性连接,包括缓冲本体,用于按缓冲条目先后顺序缓存累加结果;结果处理单元,与所述缓冲本体电性连接。本发明的实施例中,累加器缓冲模块能够一边通过缓冲本体对累加结果进行缓存,一边通过结果处理单元对缓冲本体中已缓存的累加结果进行卸载,有效提高了累加器缓冲的工作效率。

    多深度缓冲激活重发方法及装置

    公开(公告)号:CN113900816A

    公开(公告)日:2022-01-07

    申请号:CN202111201772.8

    申请日:2021-10-15

    Abstract: 本发明实施例提供一种多深度缓冲激活重发方法及装置,所述方法包括:高速缓冲存储器接收到访存请求,获取访存请求的请求地址,根据请求地址判断访存请求是否命中;未命中则发送访存请求进入脱靶缓冲,并设置第一重发标识位;高速缓冲存储器接收到后续未命中请求时,获取后续未命中请求后续地址,与请求地址进行地址相关性判断;当不相关时,发送后续未命中请求进入脱靶缓冲,设置第二重发标识位;检测到脱靶缓冲中的访存请求和后续未命中请求完成从主存装载后,通过激活重发步骤,对脱靶缓冲中的访存请求进行重发。采用本方法能够支持访存请求的乱序发射和乱序完成,同时保证脱靶请求重发后的正确性,从而提高数据Cache的性能和效率。

    一种基于动态信用的零级指令循环缓冲预取方法及装置

    公开(公告)号:CN110727463B

    公开(公告)日:2021-08-10

    申请号:CN201910863815.5

    申请日:2019-09-12

    Abstract: 本发明公开了一种基于动态信用的零级指令循环缓冲预取方法。包括当检测到指令流中存在循环体时,判断循环体的循环方向;根据循环体的循环方向确定循环体的循环出口指令信息,并根据循环出口指令信息向一级指令缓存控制部件发送预取信用信息;当检测到输出指令到达循环体尾部时,判断循环体的行进方向,若循环体的行进方向为继续循环方向,则向一级指令缓存控制部件的预取信用管理部件发送启动预取信号。本发明还公开了一种基于动态信用的零级指令循环缓冲预取装置。本发明通过预取循环出口方向的指令,可以在零级指令循环缓存中的循环退出时,立即从零级指令缓存中继续提供出口方向的指令,避免零级指令缓存脱靶时带来的性能气泡。

    芯片访存通路的高效分段测试系统、方法

    公开(公告)号:CN110718263A

    公开(公告)日:2020-01-21

    申请号:CN201910846816.9

    申请日:2019-09-09

    Abstract: 芯片访存通路的高效分段测试系统、方法,计算机体系结构与处理器微结构设计技术领域。系统包括存储控制器和存储器;存储控制器在其内部设有测试存储器、微操作控制器、IO寄存器,测试存储器用于模拟存储器的读、写延迟行为。方法包括步骤S01,存储控制器发送维护访问请求或CPU访问请求给存储器,检测存储器的访存通路能正常访问,执行步骤S02,不能正常访问,执行步骤S03;步骤S02,存储控制器在测试模式下与测试存储器进行读写数据模式测试;步骤S03,IO寄存器触发微操作控制器工作,微操作控制器发送命令给存储器,用于测试并定位访存通路存在的问题。本发明便于定位芯片访存通路问题,加速芯片的访存通路调试过程,还可实现多种DDR4流程的调试工作。

    一种基于二叉树的大窗口访存流量调度缓冲结构及方法

    公开(公告)号:CN110688209A

    公开(公告)日:2020-01-14

    申请号:CN201910852487.9

    申请日:2019-09-10

    Abstract: 本发明涉及计算机体系结构与处理器微结构技术领域,具体为一种基于二叉树的大窗口访存流量调度缓冲结构及方法。一种基于二叉树的大窗口访存流量调度缓冲结构,包括存储条目,用于记录访存请求的信息;空条目队列,用于以队列的形式挂载存储条目;调度二叉树,用于以二叉树的形式组织存储条目。访存请求的信息包括访存请求信息、条目的左子指针、条目的右子指针。本申请在访存请求到达缓冲时,即将其组织成二叉树结构,在发射时只需要选择二叉树的根节点即可,能够在面对大量访存请求时,实现大规模的访存请求调度,挖掘访存序列的局部性,提高访存带宽,缓解访存墙问题。

Patent Agency Ranking