-
公开(公告)号:CN115357313A
公开(公告)日:2022-11-18
申请号:CN202211053429.8
申请日:2022-08-31
Applicant: 无锡江南计算技术研究所
Abstract: 一种支持融合算子生成的快速代码生成装置,属于深度学习技术领域。本发明包括:LDM区域划分模块,用于根据上层框架输入的网络尺寸参数,对本地的存储空间进行功能分区;融合算子地址配置模块,用于根据上层框架输入的融合算子类型,定义算子中输入、输出、中间结果数据在功能分区中的地址;融合算子数据交互模块,提供本地与主存,及本地与本地之间异步访存的函数接口;SIMD融合算子计算模块,用于根据融合算子地址配置模块生成的地址,对算子进行融合;脉动阵列指令配置模块,用于对驱动脉动阵列进行计算的指令进行配置。本发明能够有效降低代码错误率,提高代码生成效率,简化调试过程。
-
公开(公告)号:CN115344232A
公开(公告)日:2022-11-15
申请号:CN202211017007.5
申请日:2022-08-24
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开了一种支持不同精度累加结果写回硬件的方法及装置,涉及数据处理技术领域,包括:构建多个运算单元组成的二维脉动阵列;读取本地局部存储器中的北向数据,预加载在矩阵乘法加速单元中从北向南传输;读取本地局部存储器中的西向数据,加载在矩阵乘法加速单元中从西向东传输;对西向数据和北向数据进行乘加操作;累加器缓冲接收矩阵乘法加速单元最南侧的一行运算单元传输下来的累加结果,完成所有中间结果累加;将缓存结果写回至本地局部存储器。本发明运算精度灵活可配,支持多种精度运算,同时累加结果写回电路支持写回精度灵活可配。
-
公开(公告)号:CN115271050A
公开(公告)日:2022-11-01
申请号:CN202210986888.5
申请日:2022-08-17
Applicant: 无锡江南计算技术研究所
Abstract: 一种神经网络处理器,属于高性能计算技术领域。本发明包括:控制核心,用于控制各个功能单元上的运算和处理;张量/向量/标量处理阵列,集成有n*m个张量/向量/标量处理单元,用于进行张量/向量/标量计算;内存单元,包括共享内存和若干个私有内存;片上网络单元,用于实现片上的各个功能单元之间的数据交换;集合操作加速单元,包括在线计算部件和在线压缩/解压部件,用于实现片上的支持集合操作的在线计算和在线解压缩;I/O接口单元,用于与其他神经网络处理器或者主处理器连接,以及实现芯片与其他芯片之间的数据交换。本发明能够有效提高神经网络模型训练和推理的算力,并增加数据处理的灵活性。
-
公开(公告)号:CN115269013A
公开(公告)日:2022-11-01
申请号:CN202210966615.4
申请日:2022-08-12
Applicant: 无锡江南计算技术研究所
Abstract: 本发明提供一种支持并发处理多个计算加速引擎的异步计算方法及装置,属于高性能微处理器设计技术领域。该方法包括如下步骤:S1:在加速核心内部集成多个用以处理不同的加速需求的异步计算引擎;S2:控制主流水线接收异步计算指令并基于异步计算指令获取异步计算请求;S3:基于异步计算请求从多个异步计算引擎中获取目标异步计算引擎,控制目标异步计算引擎进行异步计算处理得到处理结果,将处理结果存储在局部数据存储器中;S4:控制局部数据存储器和主流水线进行数据交互以将处理结果交互至主流水线。本发明可以支持一个或多个异步计算加速引擎,以应对应用中不同的加速需求,因此具有一定的灵活性和扩展性。
-
公开(公告)号:CN110727464B
公开(公告)日:2022-01-07
申请号:CN201910859469.3
申请日:2019-09-11
Applicant: 无锡江南计算技术研究所
IPC: G06F9/38
Abstract: 本发明提供一种针对访存空间独立的多核处理器的信息处理方法,涉及计算机设计技术领域,该方法包括以下步骤:S1:增加对目录中有效访存地址范围的记录;S2:当有访存请求时,判断访存请求能否产生新副本,若能则进入一致性流程,反之执行S3;S3:判断访存请求地址是否在有效访存地址范围内,若是则进入一致性流程,反之则无需访问目录直接进入访存流程;S4:当有经过一致性处理后需要新写入目录的访存地址时,对有效访存地址范围进行修正。本发明一种针对访存空间独立的多核处理器的信息处理方法简化不必要的目录访存行为,提高访存带宽,减少访存延迟,避免一致性处理部件成为访存瓶颈,减少芯片功耗,提高一致性处理效率。
-
公开(公告)号:CN110659144B
公开(公告)日:2022-01-07
申请号:CN201910863824.4
申请日:2019-09-12
Applicant: 无锡江南计算技术研究所
Abstract: 本发明提供支持请求响应多端口异步多播的高吞吐混合仲裁路由方法,属于计算机体系结构与芯片微结构技术领域。该支持请求响应多端口异步多播的高吞吐混合仲裁路由方法包括如下步骤:S1:处理器发出的单FLIT请求/响应包在仲裁过程中,采用混合仲裁机制以得到第一预设单FLIT请求/响应包;S2:在路由接口协议中设计用以支持第一预设单FLIT请求/响应包的多播传输的多播机制,第一预设单FLIT请求/响应包在各输出端口异步传输,各个输出端口在整个多播未完成时处理在该输出端口的后续来包,同时输入端口更新多播信号,当所有目标输出端口传输完成后释放第一预设单FLIT请求/响应包。本发明中异步多播发送匹配混合仲裁机制,两者相结合提升吞吐率。
-
公开(公告)号:CN110727530B
公开(公告)日:2021-02-19
申请号:CN201910861819.X
申请日:2019-09-12
Applicant: 无锡江南计算技术研究所
Abstract: 本发明涉及计算机体系结构与处理器微结构技术领域,具体为一种基于窗口的错误访存请求重传系统及方法。基于窗口的错误访存请求重传系统,包括重传缓冲,用于缓存正在飞行的请求,如果请求完成则将其释放,如果请求出错则根据出错请求的错误类型进行重传;错误监测模块,用于获取出错请求的错误类型。基于窗口的错误访存请求重传方法,包括1)将符合要求的请求进行发射并加入到读FIFO或写FIFO中;2)如果请求出错,则根据出错请求的错误类型通过重传发射FIFO进行重传;如果请求发射正常,则将其释放。本申请能够有效挽救大部分由于DDR4存储器访存链路上信号偶发错误导致的读ECC错、写CRC错和命令地址校验错所带来的故障,使其能够满足访存请求的保序原则。
-
公开(公告)号:CN115375973A
公开(公告)日:2022-11-22
申请号:CN202211038910.X
申请日:2022-08-29
Applicant: 无锡江南计算技术研究所
IPC: G06V10/774 , G06V10/82 , G06N3/08 , G06N3/04
Abstract: 一种支持脉动阵列进行卷积神经网络模型训练的数据重组方法,属于深度神经网络模型训练技术领域。本发明包括如下步骤:步骤1,正向卷积计算:输入和输出特征图遵循通道优先格式,卷积核遵循卷积核个数优先格式;步骤2,反向计算残差:以步骤1输出特征图的残差作为输入特征图,以步骤1中的卷积核作为卷积核;输入和输出特征图遵循通道优先格式,卷积核遵循卷积核个数优先格式;步骤3,反向计算权重:以步骤1的输入特征图作为输入特征图,以步骤1输出特征图的残差作为卷积核;输入和输出特征图遵循通道优先格式,卷积核遵循通道优先格式。本发明能够提高数据的空间局部性,省去了计算中数排布转换的需求,提升计算效率。
-
公开(公告)号:CN110727464A
公开(公告)日:2020-01-24
申请号:CN201910859469.3
申请日:2019-09-11
Applicant: 无锡江南计算技术研究所
IPC: G06F9/38
Abstract: 本发明提供一种针对访存空间独立的多核处理器的信息处理方法,涉及计算机设计技术领域,该方法包括以下步骤:S1:增加对目录中有效访存地址范围的记录;S2:当有访存请求时,判断访存请求能否产生新副本,若能则进入一致性流程,反之执行S3;S3:判断访存请求地址是否在有效访存地址范围内,若是则进入一致性流程,反之则无需访问目录直接进入访存流程;S4:当有经过一致性处理后需要新写入目录的访存地址时,对有效访存地址范围进行修正。本发明一种针对访存空间独立的多核处理器的信息处理方法简化不必要的目录访存行为,提高访存带宽,减少访存延迟,避免一致性处理部件成为访存瓶颈,减少芯片功耗,提高一致性处理效率。
-
公开(公告)号:CN110727530A
公开(公告)日:2020-01-24
申请号:CN201910861819.X
申请日:2019-09-12
Applicant: 无锡江南计算技术研究所
Abstract: 本发明涉及计算机体系结构与处理器微结构技术领域,具体为一种基于窗口的错误访存请求重传系统及方法。基于窗口的错误访存请求重传系统,包括重传缓冲,用于缓存正在飞行的请求,如果请求完成则将其释放,如果请求出错则根据出错请求的错误类型进行重传;错误监测模块,用于获取出错请求的错误类型。基于窗口的错误访存请求重传方法,包括1)将符合要求的请求进行发射并加入到读FIFO或写FIFO中;2)如果请求出错,则根据出错请求的错误类型通过重传发射FIFO进行重传;如果请求发射正常,则将其释放。本申请能够有效挽救大部分由于DDR4存储器访存链路上信号偶发错误导致的读ECC错、写CRC错和命令地址校验错所带来的故障,使其能够满足访存请求的保序原则。
-
-
-
-
-
-
-
-
-