-
公开(公告)号:CN103076849B
公开(公告)日:2014-07-02
申请号:CN201210580256.5
申请日:2012-12-26
Applicant: 无锡江南计算技术研究所
Inventor: 谢向辉 , 吴东 , 钱磊 , 原昊 , 张昆 , 臧春峰 , 郝子宇 , 张鲁飞 , 李玺 , 严忻凯 , 邬贵明 , 方兴 , 叶楠 , 胡苏太 , 韦海亮 , 周浩杰 , 陶志荣
Abstract: 一种可重构微服务器系统,包括:微处理器、系统总线、内存、可重构加速部件以及输入输出外设;其中,微处理器、内存和输入输出外设连接至系统总线,从而微处理器通过系统总线与内存和输入输出外设进行数据交换;而且,可重构加速部件连接至微处理器和/或系统总线,从而与微处理器和/或连接在系统总线上的内存和输入输出外设进行数据交换。此外,可重构加速部件可以连接独立的内存、输入输出外设和其它扩展接口。
-
公开(公告)号:CN102446159B
公开(公告)日:2013-09-18
申请号:CN201010508870.1
申请日:2010-10-12
Applicant: 无锡江南计算技术研究所
IPC: G06F15/167 , G06F12/02
Abstract: 一种多核处理器的数据管理方法及装置,所述多核处理器包括处理器核心阵列和处理器核心互连结构,所述处理器核心阵列包括多个处理器核心,所述处理器核心包括具有多个存储单元的核内存储器,所述处理器核心互连结构用于所述处理器核心阵列中任意两处理器核心间的通信,所述方法包括:对所述处理器核心的核内存储器的存储单元分配存储地址;根据所述存储单元的存储地址在至少一个处理器核心的核内存储器和主存之间进行数据传输。本发明提高了数据的读写效率,利用批量化的访存方式,将多次数据访问合并,避免了零散访问主存的效率损失问题,并提供了多种编址方式和相应的数据传输方式,能够满足多种计算过程的应用需要。
-
公开(公告)号:CN103064820A
公开(公告)日:2013-04-24
申请号:CN201210574582.5
申请日:2012-12-26
Applicant: 无锡江南计算技术研究所
Inventor: 谢向辉 , 吴东 , 钱磊 , 原昊 , 张昆 , 臧春峰 , 郝子宇 , 张鲁飞 , 李玺 , 严忻凯 , 邬贵明 , 方兴 , 叶楠 , 胡苏太 , 韦海亮 , 周浩杰 , 陶志荣
Abstract: 一种基于可重构微服务器的集群计算系统,包括:多个可重构微服务器计算节点以及通用可扩展交换网络;多个可重构微服务器计算节点具有通用网络接口;并且通用可扩展交换网络基于通用的标准网络协议,通过网络拓扑结构将所述多个可重构微服务器计算节点的通用网络接口互连在一起。所述可重构微服务器计算节点还包括:微处理器、系统总线、内存、可重构加速部件以及输入输出外设;其中,微处理器、内存和输入输出外设连接至系统总线,从而微处理器通过系统总线与内存和输入输出外设进行数据交换;可重构加速部件连接至微处理器和/或系统总线,从而与微处理器和/或连接在系统总线上的内存和输入输出外设进行数据交换。
-
公开(公告)号:CN103020008A
公开(公告)日:2013-04-03
申请号:CN201210575648.2
申请日:2012-12-26
Applicant: 无锡江南计算技术研究所
Inventor: 谢向辉 , 吴东 , 原昊 , 钱磊 , 张昆 , 臧春峰 , 郝子宇 , 张鲁飞 , 李玺 , 严忻凯 , 邬贵明 , 方兴 , 叶楠 , 胡苏太 , 韦海亮 , 周浩杰 , 陶志荣
IPC: G06F15/76
Abstract: 本发明提供了一种计算能力增强的可重构微服务器,包括:微处理器、系统总线、内存、可重构加速部件以及输入输出外设;其中,微处理器、内存和输入输出外设连接至系统总线,从而微处理器通过系统总线与内存和输入输出外设进行数据交换;而且,微处理器直接连接至可重构加速部件;并且,可重构加速部件连接至系统总线,从而通过系统总线与内存和输入输出外设进行数据交换;其中,可重构加速部件包括可重构指令扩展单元、可重构硬件线程单元以及可重构任务加速单元中的至少一个。
-
公开(公告)号:CN102932166A
公开(公告)日:2013-02-13
申请号:CN201210379888.5
申请日:2012-10-09
Applicant: 无锡江南计算技术研究所
Abstract: 本发明提供的一种集群电源管理系统包括:一个或多个计算节点组,其中每个计算节点组包括多个计算节点;与所述多个计算节点组分别对应的多个电源管理模块,其中对于每个计算节点组,在该计算节点组单独使用时,计算节点组中的作为主计算节点的一个计算节点通过控制信号对相应的电源管理模块进行配置,进而管理本计算节点组;主控节点,其通过电源管理模块的唯一地址选择电源管理模块以便对该电源管理模块进行配置;电源管理网络,用于处理电源管理模块与主控节点的通信。
-
公开(公告)号:CN102760097A
公开(公告)日:2012-10-31
申请号:CN201110110819.X
申请日:2011-04-29
Applicant: 无锡江南计算技术研究所
IPC: G06F11/36
Abstract: 一种计算机体系结构性能模拟方法及系统,所述计算机体系结构性能模拟方法包括:建立包含目标应用的基本模块的应用抽象模型,所述基本模块包括基本计算模块和基本通信模块;根据目标机的体系结构特征,建立所述基本模块的体系结构抽象模型;建立包含通用模拟平台的体系结构性能模拟器,并将所述体系结构抽象模型以模块形式耦合至所述体系结构性能模拟器中,所述体系结构性能模拟器具有与所述应用抽象模型进行通信的模拟接口;调用所述模拟接口,以参数形式传递所述应用抽象模型的计算信息和通信信息,驱动所述体系结构性能模拟器完成目标机体系结构的性能模拟。所述模拟方法简化了性能模拟器实现,提升模拟速度,提高运行和配置的灵活性。
-
公开(公告)号:CN115374912A
公开(公告)日:2022-11-22
申请号:CN202211038174.8
申请日:2022-08-29
Applicant: 无锡江南计算技术研究所
Abstract: 本发明涉及计算机数据计算领域,具体涉及到异构计算系统的设计。本发明是通过以下技术方案得以实现的:一种用于异构计算的融合算子设计方法,包含如下步骤:S01、归一化算子划分步骤;在该步骤中,将归一化算子划分成和计算算子与线性缩放算子两个算子,S02、算子融合步骤;依次将所述线性缩放算子、激活算子、卷积算子、所述和计算算子组成一个融合算子。本发明的目的是提供一种用于异构计算的融合算子设计方法和异构计算系统,在保证操作的正确性和操作种类不变的情况下,对算子的融合方式进行全新的设计和拆分,使得大量计算过程的数据交互均在片上进行,优化数据交互的带宽使用效率。
-
公开(公告)号:CN115269200A
公开(公告)日:2022-11-01
申请号:CN202210977978.8
申请日:2022-08-16
Applicant: 无锡江南计算技术研究所
Abstract: 本发明涉及计算机数据计算领域,具体处理器多核处理的加速方法。本发明是通过以下技术方案得以实现的:一种支持cache更新的一致性加速处理方法,包含如下步骤:S01、生产核心数据生产步骤;生产核心生产出批量数据;S02、完成通知即时发送步骤;所述生产核心给一致性串行点发送完成通知;S03、串行点取数据步骤;所述一致性串行点从所述生产核心处获得刚处理完的数据,且将数据转存到主存中,在转存结束之前,该生产核心不生产新的数据;S04、消费核心获得数据步骤。本发明的目的是提供一种支持cache更新的一致性加速处理方法,在保证cache一致性的基础上,解决一致性操作的延迟开销,避免生产核心的多任务竞争,减少数据处理的延迟,提升效率。
-
公开(公告)号:CN115169541A
公开(公告)日:2022-10-11
申请号:CN202210986917.8
申请日:2022-08-17
Applicant: 无锡江南计算技术研究所
IPC: G06N3/04 , G06F15/173 , G06F9/50 , G06F9/48
Abstract: 一种张量、向量、标量计算加速和数据调度系统,属于高性能计算技术领域。本发明包括:标量处理单元:用于取指和译码,以及发送指令;向量处理单元:用于接收来自标量处理单元的向量指令,完成向量类型数据的调度和计算;张量处理单元:用于接收来自标量处理单元的张量指令,完成张量类型数据的调度和计算;多端口本地数据存储单元:用于存储不同处理单元处理的数据,并支持不同处理单元对自身处理数据的同时读写;多功能直接内存访问单元:用于实现内存到各个功能单元之间的数据通信;在线远程存储访问单元:用于实现不同处理单元间数据的直接交互。本发明能够有效提升复杂算法中张量计算、向量计算、标量计算的算力和数据调度的灵活性。
-
公开(公告)号:CN112163187A
公开(公告)日:2021-01-01
申请号:CN202011290004.X
申请日:2020-11-18
Applicant: 无锡江南计算技术研究所
IPC: G06F17/14
Abstract: 本发明涉及数字信号处理领域,具体涉及一种超长点数超高性能FFT计算装置。本发明通过以下技术方案得以实现的:一种超长点数超高性能FFT计算装置,包含FFT计算模块和控制单元,所述FFT计算模块数量为两个,分别为计算模块一和计算模块二;还包含两个三维转置存储器和二维转置存储器;三维转置存储器一的数据输入端连接主存,数据输出端连接计算模块一;所述二维转置存储器的数据输入端连接所述计算模块一,数据输出端连接所述计算模块二。本发明的目的是提供一种超长点数超高性能FFT计算装置,通过全新的数据转置处理方式,增加数据平滑性,使得FFT数据处理过程中数据带宽利用率高,大大增加处理效率。
-
-
-
-
-
-
-
-
-