-
公开(公告)号:CN102760114A
公开(公告)日:2012-10-31
申请号:CN201110110825.5
申请日:2011-04-29
Applicant: 无锡江南计算技术研究所
IPC: G06F15/173 , G06F9/54 , G06F9/455
Abstract: 一种多处理器系统的通信仿真方法、引擎及系统,所述方法包括:创建多个仿真进程,每一个仿真进程对所述多处理器系统中的一个处理器进行仿真;获取所述多处理器系统中发送端处理器发出的通信消息,对所述发送端处理器的发送过程进行仿真,将所述通信消息转换为网络数据包;基于所述仿真进程之间的通信机制将所述网络数据包传输至对接收端处理器进行仿真的仿真进程;对所述接收端处理器的接收过程进行仿真,将所述网络数据包拆解为通信消息并将其传输至所述接收端处理器。本发明提高了通信仿真过程的可复用性。
-
公开(公告)号:CN115373849A
公开(公告)日:2022-11-22
申请号:CN202211038180.3
申请日:2022-08-29
Applicant: 无锡江南计算技术研究所
Abstract: 本发明属于高性能微处理器领域,涉及一种支持脉动阵列高效计算的方法及系统。方法包括:S1将第一矩阵数据中的行数据在二维脉动阵列中以第一方向进行传输,以将第一矩阵数据中的各行数据预加载至二维脉动阵列中的各行运算CU中;S2按时钟将第二矩阵数据中带有使能更新信号的列数据以自上而下延迟依次增加的模式在二维脉动阵列中以第二方向进行传输,以将第二矩阵数据中的各列数据实时输入至二维脉动阵列中的相应运算CU中;本发明将第一矩阵数据中的各行数据预加载至二维脉动阵列中的各行运算CU中,其次,第二矩阵数据中带有使能更新信号,并根据所述使能更新信号直接提取预加载在CU单元中的所需数据。实现了第一矩阵数据加载的无缝切换与实时更新。
-
公开(公告)号:CN115344823A
公开(公告)日:2022-11-15
申请号:CN202211017041.2
申请日:2022-08-24
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开了一种并行查找表实现具有饱和特性非线性函数求解的方法,涉及神经网络技术领域,包括将非线性函数分割成若干区间,每个区间内函数值由线性函数表示,其中线性函数系数存放在查找表内,查找表位于局部存储内,获得查找表的表内有符号偏移地址,计算出线性系数并写入查找表内;通过配置描述符实现非线性函数求解精度与求解范围的灵活可配,得到源操作数取值范围以及查找表深度;采用对源操作数范围进行平均分割的方法进行查找表地址转换,进行非线性函数求解。本发明以在兼顾资源消耗和计算速度情况下,进一步提高硬件求解非线性函数的精度,并且可以根据不同精度饱和函数进行求解运算。
-
公开(公告)号:CN115328404A
公开(公告)日:2022-11-11
申请号:CN202211017009.4
申请日:2022-08-24
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开了一种支持数据在线重组的DMA访存方法及装置,涉及数据处理技术领域,包括:DMA引擎收到DMA传输指令时,判断DMA传输指令中是否有数据重组指示,若是则获取数据传输方向以及数据重组参数信息;DMA引擎将收到的DMA指令解析并拆分为访问请求发送至传输方向上游存储;DMA引擎收到上游存储发来的访问响应数据时,将响应数据重组存放于DMA引擎内部的数据缓冲中;当数据缓冲收齐本次DMA传输指令中的所有数据,按照DMA传输指令中的数据重组参数,以重组后的格式转发给下游存储。本发明支持数据在线重组,使得数据重组过程对运算核心透明,为程序员编程提供便利性和灵活性,降低数据格式转变的实现代价和功耗。
-
公开(公告)号:CN115237603A
公开(公告)日:2022-10-25
申请号:CN202211038909.7
申请日:2022-08-29
Applicant: 无锡江南计算技术研究所
Abstract: 一种用于脉动阵列的数据调度方法,属于神经网络技术领域。本发明包括:步骤1,令待卷积/待矩阵乘的数据A分布在m个核心上;步骤2,将数据B广播给m个核心,m个核心每轮得到相同的b进行计算;步骤3,当每个核心上的分布式数据A与所有的b计算完成,将结果写回主存;步骤4,重复步骤1‑3进行数据A下一部分的计算。本发明能够有效提升片上数据的复用次数,降低带宽需求,可以有效提升硬件加速器性能。
-
公开(公告)号:CN110727463A
公开(公告)日:2020-01-24
申请号:CN201910863815.5
申请日:2019-09-12
Applicant: 无锡江南计算技术研究所
IPC: G06F9/30
Abstract: 本发明公开了一种基于动态信用的零级指令循环缓冲预取方法。包括当检测到指令流中存在循环体时,判断循环体的循环方向;根据循环体的循环方向确定循环体的循环出口指令信息,并根据循环出口指令信息向一级指令缓存控制部件发送预取信用信息;当检测到输出指令到达循环体尾部时,判断循环体的行进方向,若循环体的行进方向为继续循环方向,则向一级指令缓存控制部件的预取信用管理部件发送启动预取信号。本发明还公开了一种基于动态信用的零级指令循环缓冲预取装置。本发明通过预取循环出口方向的指令,可以在零级指令循环缓存中的循环退出时,立即从零级指令缓存中继续提供出口方向的指令,避免零级指令缓存脱靶时带来的性能气泡。
-
公开(公告)号:CN105354169A
公开(公告)日:2016-02-24
申请号:CN201510673521.8
申请日:2015-10-15
Applicant: 浪潮电子信息产业股份有限公司 , 无锡江南计算技术研究所
IPC: G06F15/18
CPC classification number: G06F15/18
Abstract: 本发明提供了一种基于动态一致性约束的图计算异步迭代方法,包括:开始图计算异步迭代处理,并且在开始时将所有节点中的活跃点的异步迭代模式设置为点一致异步迭代模式;在图计算异步迭代处理的过程中,改变至少一部分当前活跃点的异步迭代模式。
-
公开(公告)号:CN102761472B
公开(公告)日:2015-07-15
申请号:CN201110110820.2
申请日:2011-04-29
Applicant: 无锡江南计算技术研究所
IPC: H04L12/701 , H04L29/10
Abstract: 一种通信端口的路由方法包括:获取拓扑结构描述文件;获取通信源端的端口的名称;在所述拓扑结构描述文件中查找与所述通信源端的端口对应的通信目的端的端口的名称及通信目的端的标识;记录通信端口信息,基于所述通信端口信息为所述通信源端和通信目的端建立通信端口并配置通信通道。本发明公开的技术方案,降低了部件模型和并行事务级模拟系统之间的耦合度,提高并行事务级模拟系统的开发效率,降低对部件模型和并行事务级模拟系统维护的开销。
-
公开(公告)号:CN102904943B
公开(公告)日:2015-07-08
申请号:CN201210372418.6
申请日:2012-09-28
Applicant: 无锡江南计算技术研究所
IPC: H04L29/08 , H04L12/863
Abstract: 本发明提供了一种基于嵌入式处理器存储接口的集群计算系统混合通信方法。将嵌入式处理器集成的网络控制器通过网络收发器连接至第一网络。将并行存储接口通过混合网络通信模块连接至第二网络。当并行接口状态机从与并行存储接口连接的存储总线接收到数据时,将数据存放到发送队列。利用接收控制逻辑从第二网络接收到数据包并拆解数据包,然后根据数据包的目的地址,选择将数据包存放到接收队列或转发队列,其中接收队列缓存待转发至并行存储接口的数据。当接收队列非空,且与并行存储接口连接的存储总线未占用时,将数据发送到存储总线上。利用发送控制逻辑对发送队列和转发队列进行仲裁,基于年龄策略选择最老年龄的数据包进行发送。
-
公开(公告)号:CN102760097B
公开(公告)日:2015-01-14
申请号:CN201110110819.X
申请日:2011-04-29
Applicant: 无锡江南计算技术研究所
IPC: G06F11/36
Abstract: 一种计算机体系结构性能模拟方法及系统,所述计算机体系结构性能模拟方法包括:建立包含目标应用的基本模块的应用抽象模型,所述基本模块包括基本计算模块和基本通信模块;根据目标机的体系结构特征,建立所述基本模块的体系结构抽象模型;建立包含通用模拟平台的体系结构性能模拟器,并将所述体系结构抽象模型以模块形式耦合至所述体系结构性能模拟器中,所述体系结构性能模拟器具有与所述应用抽象模型进行通信的模拟接口;调用所述模拟接口,以参数形式传递所述应用抽象模型的计算信息和通信信息,驱动所述体系结构性能模拟器完成目标机体系结构的性能模拟。所述模拟方法简化了性能模拟器实现,提升模拟速度,提高运行和配置的灵活性。
-
-
-
-
-
-
-
-
-