-
公开(公告)号:CN115237603A
公开(公告)日:2022-10-25
申请号:CN202211038909.7
申请日:2022-08-29
Applicant: 无锡江南计算技术研究所
Abstract: 一种用于脉动阵列的数据调度方法,属于神经网络技术领域。本发明包括:步骤1,令待卷积/待矩阵乘的数据A分布在m个核心上;步骤2,将数据B广播给m个核心,m个核心每轮得到相同的b进行计算;步骤3,当每个核心上的分布式数据A与所有的b计算完成,将结果写回主存;步骤4,重复步骤1‑3进行数据A下一部分的计算。本发明能够有效提升片上数据的复用次数,降低带宽需求,可以有效提升硬件加速器性能。
-
公开(公告)号:CN110716797A
公开(公告)日:2020-01-21
申请号:CN201910852485.X
申请日:2019-09-10
Applicant: 无锡江南计算技术研究所
Abstract: 本发明涉及计算机体系结构与处理器微结构技术领域,具体为一种面向多请求来源的DDR4性能平衡调度结构及方法。一种面向多请求来源的DDR4性能平衡调度结构,包括多个访存请求调度缓冲,用于提高对应访存请求来源的访存带宽;多来源的连续仲裁部件,用于选择出一个访存请求进行发射;DDR4存储器件,用于接收多来源的连续仲裁部件发射的访存请求。一种面向多请求来源的DDR4性能平衡调度方法,包括L1.对每个访存请求来源的访存请求均设置一个访存请求调度缓冲;L2.多来源的连续仲裁部件通过仲裁策略选择出一个访存请求进行发射。本申请面向多请求来源分别设置多个访存请求调度缓冲,能够在提高访存带宽的同时,减少对访存延迟的影响,提高了系统的综合访存性能。
-
公开(公告)号:CN110691043A
公开(公告)日:2020-01-14
申请号:CN201910857257.1
申请日:2019-09-11
Applicant: 无锡江南计算技术研究所
IPC: H04L12/931 , H04L12/933 , H04L12/803 , H04L12/861 , H04L12/863
Abstract: 本发明提供一种支持多源多虚通道非连续传输的插花整理方法,涉及计算机设计技术领域,方法包括以下步骤:S1:目标节点对接收的微片进行解析,将不同微片发送到相应虚通道的接收队列;S2:每个虚通道的接收队列设置一组正在接收包的标记存储器,标记内容;S3:每个虚通道的接收队列中的每个条目均进行接收队列处理;S4:设置一个提交条目地址辅助队列,将各虚通道的报文各个微片的地址依次存入,根据辅助队列的输出依次读取相应的虚通道中的队列条目。本发明一种支持多源多虚通道非连续传输的插花整理方法支持多源多虚通道非连续传输的插花报文的接收和整理,提高了片上网络有效带宽,减少阻塞,减少片上网络死锁和负载不均衡现象。
-
公开(公告)号:CN115357313A
公开(公告)日:2022-11-18
申请号:CN202211053429.8
申请日:2022-08-31
Applicant: 无锡江南计算技术研究所
Abstract: 一种支持融合算子生成的快速代码生成装置,属于深度学习技术领域。本发明包括:LDM区域划分模块,用于根据上层框架输入的网络尺寸参数,对本地的存储空间进行功能分区;融合算子地址配置模块,用于根据上层框架输入的融合算子类型,定义算子中输入、输出、中间结果数据在功能分区中的地址;融合算子数据交互模块,提供本地与主存,及本地与本地之间异步访存的函数接口;SIMD融合算子计算模块,用于根据融合算子地址配置模块生成的地址,对算子进行融合;脉动阵列指令配置模块,用于对驱动脉动阵列进行计算的指令进行配置。本发明能够有效降低代码错误率,提高代码生成效率,简化调试过程。
-
公开(公告)号:CN115271050A
公开(公告)日:2022-11-01
申请号:CN202210986888.5
申请日:2022-08-17
Applicant: 无锡江南计算技术研究所
Abstract: 一种神经网络处理器,属于高性能计算技术领域。本发明包括:控制核心,用于控制各个功能单元上的运算和处理;张量/向量/标量处理阵列,集成有n*m个张量/向量/标量处理单元,用于进行张量/向量/标量计算;内存单元,包括共享内存和若干个私有内存;片上网络单元,用于实现片上的各个功能单元之间的数据交换;集合操作加速单元,包括在线计算部件和在线压缩/解压部件,用于实现片上的支持集合操作的在线计算和在线解压缩;I/O接口单元,用于与其他神经网络处理器或者主处理器连接,以及实现芯片与其他芯片之间的数据交换。本发明能够有效提高神经网络模型训练和推理的算力,并增加数据处理的灵活性。
-
公开(公告)号:CN115268838A
公开(公告)日:2022-11-01
申请号:CN202210966726.5
申请日:2022-08-12
Applicant: 无锡江南计算技术研究所
IPC: G06F7/53 , G06F7/509 , G06F3/06 , G06F9/445 , G06F12/0877
Abstract: 本发明涉及累加器缓冲技术领域,具体为一种累加器缓冲结构及其数据累加卸载方法。一种累加器缓冲结构,包括一累加器缓冲控制逻辑;以及多个累加器缓冲模块,每一所述累加器缓冲模块均包括双缓冲单元,包括第一缓冲和第二缓冲,当所述第一缓冲处于第一工作模式时,所述第二缓冲处于第二工作模式;当所述第一缓冲处于第二工作模式时,所述第二缓冲处于第一工作模式;其中,所述第一工作模式为对累加结果进行缓存。本发明的实施例中,累加器缓冲模块可以通过第一缓冲对累加结果进行缓存,同时可以对第二缓冲中已缓存的累加结果进行卸载,省去了现有技术中等待累加结果卸载的时间,进而有效提高了累加器缓冲的工作效率。
-
公开(公告)号:CN110727464B
公开(公告)日:2022-01-07
申请号:CN201910859469.3
申请日:2019-09-11
Applicant: 无锡江南计算技术研究所
IPC: G06F9/38
Abstract: 本发明提供一种针对访存空间独立的多核处理器的信息处理方法,涉及计算机设计技术领域,该方法包括以下步骤:S1:增加对目录中有效访存地址范围的记录;S2:当有访存请求时,判断访存请求能否产生新副本,若能则进入一致性流程,反之执行S3;S3:判断访存请求地址是否在有效访存地址范围内,若是则进入一致性流程,反之则无需访问目录直接进入访存流程;S4:当有经过一致性处理后需要新写入目录的访存地址时,对有效访存地址范围进行修正。本发明一种针对访存空间独立的多核处理器的信息处理方法简化不必要的目录访存行为,提高访存带宽,减少访存延迟,避免一致性处理部件成为访存瓶颈,减少芯片功耗,提高一致性处理效率。
-
公开(公告)号:CN107766246A
公开(公告)日:2018-03-06
申请号:CN201710971346.X
申请日:2017-10-18
Applicant: 无锡江南计算技术研究所
IPC: G06F11/36
CPC classification number: G06F11/3608 , G06F11/3624
Abstract: 本发明公开一种软件产品自主可控度评估方法,包括:基于过程要素的层次分析模型,依据软件产品开发生产过程设定评估指标;确定所述评估指标的权重值,并设定所述评估指标的二级评估内容的得分;分别计算所述评估指标的自主可控度,并通过加权计算获得软件产品自主可控度。本发明能够准确、全面的计算出软件产品的自主化程度,评估出软件产品的国产化率,是一种可量化的软件产品自主可控度评估方法。本发明可以指导产品研制部门开展自主可控度自评价,促进产品不断改进完善和自主化水平的提高,也可以作为第三方评估机构开展产品自主可控度评估的基本依据,评估结果可以为应用部门把握产品自主可控程度、开展产品选型工作提供数据支撑。
-
公开(公告)号:CN114036102A
公开(公告)日:2022-02-11
申请号:CN202111345367.3
申请日:2021-11-15
Applicant: 无锡江南计算技术研究所
IPC: G06F15/173 , G06Q20/40
Abstract: 本发明实施例提供一种支付撤销的多类型分布式管理方法及装置,所述方法包括:获取参与同步操作的处理器核,并确定处理器核中的管理者处理器核及参与者处理器核;并在管理者处理器核中设置与参与者处理器核相应的同步标记位;当接收到同步操作请求时,根据请求处理器核将管理者处理器核中的同步标记位标记为1,在接收到同步操作请求的完成信号时,清除同步标记位;接收到同步撤销请求时,检测请求处理器核对应的同步标记位为1,撤销请求处理器核对应的同步标记位。采用本方法能够支持阵列内同步操作及对应同步撤销操作的并发,发现存在未完成的同步时,可向管理者处理器核发送同步撤销请求,撤销未完成的同步操作,以便进行作业保留恢复流程。
-
公开(公告)号:CN115375973A
公开(公告)日:2022-11-22
申请号:CN202211038910.X
申请日:2022-08-29
Applicant: 无锡江南计算技术研究所
IPC: G06V10/774 , G06V10/82 , G06N3/08 , G06N3/04
Abstract: 一种支持脉动阵列进行卷积神经网络模型训练的数据重组方法,属于深度神经网络模型训练技术领域。本发明包括如下步骤:步骤1,正向卷积计算:输入和输出特征图遵循通道优先格式,卷积核遵循卷积核个数优先格式;步骤2,反向计算残差:以步骤1输出特征图的残差作为输入特征图,以步骤1中的卷积核作为卷积核;输入和输出特征图遵循通道优先格式,卷积核遵循卷积核个数优先格式;步骤3,反向计算权重:以步骤1的输入特征图作为输入特征图,以步骤1输出特征图的残差作为卷积核;输入和输出特征图遵循通道优先格式,卷积核遵循通道优先格式。本发明能够提高数据的空间局部性,省去了计算中数排布转换的需求,提升计算效率。
-
-
-
-
-
-
-
-
-