-
公开(公告)号:CN115357854A
公开(公告)日:2022-11-18
申请号:CN202211045832.6
申请日:2022-08-30
Applicant: 无锡江南计算技术研究所
Abstract: 本发明涉及机器学习技术领域,具体涉及一种高效的矩阵乘运算加速装置及方法,包括矩阵乘法加速单元、北向数据加载器、西向数据整形与加载器、累加缓冲器、累加结果写回控制器和本地局部存储器,矩阵乘法加速单元包括呈二维脉动阵列排列的矩阵乘法加速核心,矩阵乘法加速单元通过北向数据加载器从本地局部存储器获取北向数据,西向数据整形与加载器从本地局部存储器获取西向数据并整形,矩阵乘法加速核心的运算单元进行乘加运算,乘加结果输入至累加缓冲器,全部运算结束后,累加结果写回本地局部存储器。本发明的有益技术性效果包括:北向数据可以预加载,掩盖延迟;2)固定北向数据,增加数据重用性;3)减少数据流动,降低功耗。
-
公开(公告)号:CN110727464A
公开(公告)日:2020-01-24
申请号:CN201910859469.3
申请日:2019-09-11
Applicant: 无锡江南计算技术研究所
IPC: G06F9/38
Abstract: 本发明提供一种针对访存空间独立的多核处理器的信息处理方法,涉及计算机设计技术领域,该方法包括以下步骤:S1:增加对目录中有效访存地址范围的记录;S2:当有访存请求时,判断访存请求能否产生新副本,若能则进入一致性流程,反之执行S3;S3:判断访存请求地址是否在有效访存地址范围内,若是则进入一致性流程,反之则无需访问目录直接进入访存流程;S4:当有经过一致性处理后需要新写入目录的访存地址时,对有效访存地址范围进行修正。本发明一种针对访存空间独立的多核处理器的信息处理方法简化不必要的目录访存行为,提高访存带宽,减少访存延迟,避免一致性处理部件成为访存瓶颈,减少芯片功耗,提高一致性处理效率。
-
公开(公告)号:CN110601996A
公开(公告)日:2019-12-20
申请号:CN201910841876.1
申请日:2019-09-06
Applicant: 无锡江南计算技术研究所
IPC: H04L12/819 , H04L12/801 , H04L12/803 , H04L12/863
Abstract: 一种采用令牌保底分布式贪心算法的环网防饥饿流控方法,属于分布控制环网流控技术领域。方法包括步骤S01,当监测到环网的网上状态为空闲时,本地节点发送报文上网;步骤S02,本地节点在一定时间后仍未能传送报文时,请求网上正在传送报文的微片携带对应令牌;步骤S03,环网上传送报文的微片依次传送,微片传送至目标节点后下网,令牌绕环网传送回到本地节点并失效;其中,在微片自本地节点传送至目标节点的路径中的其他节点不能上网。本发明在不增加额外缓冲资源的前提下,避免饥饿问题、平衡各节点负载,优化环网的性能和可实现性。
-
公开(公告)号:CN115374912A
公开(公告)日:2022-11-22
申请号:CN202211038174.8
申请日:2022-08-29
Applicant: 无锡江南计算技术研究所
Abstract: 本发明涉及计算机数据计算领域,具体涉及到异构计算系统的设计。本发明是通过以下技术方案得以实现的:一种用于异构计算的融合算子设计方法,包含如下步骤:S01、归一化算子划分步骤;在该步骤中,将归一化算子划分成和计算算子与线性缩放算子两个算子,S02、算子融合步骤;依次将所述线性缩放算子、激活算子、卷积算子、所述和计算算子组成一个融合算子。本发明的目的是提供一种用于异构计算的融合算子设计方法和异构计算系统,在保证操作的正确性和操作种类不变的情况下,对算子的融合方式进行全新的设计和拆分,使得大量计算过程的数据交互均在片上进行,优化数据交互的带宽使用效率。
-
公开(公告)号:CN115169541A
公开(公告)日:2022-10-11
申请号:CN202210986917.8
申请日:2022-08-17
Applicant: 无锡江南计算技术研究所
IPC: G06N3/04 , G06F15/173 , G06F9/50 , G06F9/48
Abstract: 一种张量、向量、标量计算加速和数据调度系统,属于高性能计算技术领域。本发明包括:标量处理单元:用于取指和译码,以及发送指令;向量处理单元:用于接收来自标量处理单元的向量指令,完成向量类型数据的调度和计算;张量处理单元:用于接收来自标量处理单元的张量指令,完成张量类型数据的调度和计算;多端口本地数据存储单元:用于存储不同处理单元处理的数据,并支持不同处理单元对自身处理数据的同时读写;多功能直接内存访问单元:用于实现内存到各个功能单元之间的数据通信;在线远程存储访问单元:用于实现不同处理单元间数据的直接交互。本发明能够有效提升复杂算法中张量计算、向量计算、标量计算的算力和数据调度的灵活性。
-
公开(公告)号:CN110691043B
公开(公告)日:2021-10-29
申请号:CN201910857257.1
申请日:2019-09-11
Applicant: 无锡江南计算技术研究所
IPC: H04L12/931 , H04L12/933 , H04L12/803 , H04L12/861 , H04L12/863
Abstract: 本发明提供一种支持多源多虚通道非连续传输的插花整理方法,涉及计算机设计技术领域,方法包括以下步骤:S1:目标节点对接收的微片进行解析,将不同微片发送到相应虚通道的接收队列;S2:每个虚通道的接收队列设置一组正在接收包的标记存储器,标记内容;S3:每个虚通道的接收队列中的每个条目均进行接收队列处理;S4:设置一个提交条目地址辅助队列,将各虚通道的报文各个微片的地址依次存入,根据辅助队列的输出依次读取相应的虚通道中的队列条目。本发明一种支持多源多虚通道非连续传输的插花整理方法支持多源多虚通道非连续传输的插花报文的接收和整理,提高了片上网络有效带宽,减少阻塞,减少片上网络死锁和负载不均衡现象。
-
公开(公告)号:CN110601996B
公开(公告)日:2021-06-04
申请号:CN201910841876.1
申请日:2019-09-06
Applicant: 无锡江南计算技术研究所
IPC: H04L12/819 , H04L12/801 , H04L12/803 , H04L12/863
Abstract: 一种采用令牌保底分布式贪心算法的环网防饥饿流控方法,属于分布控制环网流控技术领域。方法包括步骤S01,当监测到环网的网上状态为空闲时,本地节点发送报文上网;步骤S02,本地节点在一定时间后仍未能传送报文时,请求网上正在传送报文的微片携带对应令牌;步骤S03,环网上传送报文的微片依次传送,微片传送至目标节点后下网,令牌绕环网传送回到本地节点并失效;其中,在微片自本地节点传送至目标节点的路径中的其他节点不能上网。本发明在不增加额外缓冲资源的前提下,避免饥饿问题、平衡各节点负载,优化环网的性能和可实现性。
-
-
-
-
-
-