-
公开(公告)号:CN117493016A
公开(公告)日:2024-02-02
申请号:CN202311558739.X
申请日:2023-11-21
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出一种晶上系统节点管理和任务调度装置及其使用方法,包括晶上系统和主控系统;晶上系统包括多个互连的模组,每个模组包括多个互连的通用处理器和I/O节点;其将多个通用处理器分为用于接收和分配任务的Master处理器和用于处理任务的Worker处理器;主控系统通过以太网与Master处理器相连,用于将计算任务通过以太网发送至Master处理器,Master处理器将计算任务分配给Worker处理器,并将Worker处理器执行计算任务的结果收集和整理后通过以太网回传给主控系统;主控系统通过PCIe通道与I/O节点相连,用于将任务数据通过PCIe通道传输给I/O节点,I/O节点中信号处理模块对任务数据进行处理后回传给主控系统。
-
公开(公告)号:CN113451260B
公开(公告)日:2024-01-16
申请号:CN202110612403.1
申请日:2021-06-02
Applicant: 中国科学院计算技术研究所
IPC: H01L23/50 , H10B80/00 , H01L21/768
Abstract: 本发明提出一种基于系统总线的三维芯片及其三维化方法,包括至少两片同构逻辑芯片,且该同构逻辑芯片间相互垂直堆叠,同构逻辑芯片间的各个模块相互重合;每片同构逻辑芯片内部的系统总线与相邻其同构逻辑芯片内部的系统总线相连。本发明通过上述结构实现同构芯片之间的通信,以实现芯片的3D化。
-
公开(公告)号:CN111695685B
公开(公告)日:2023-09-26
申请号:CN202010395809.4
申请日:2020-05-12
Applicant: 中国科学院计算技术研究所
IPC: G06F16/903 , G06F16/901 , G06N3/042 , G06N3/063
Abstract: 本发明提出一种面向图神经网络应用的片上存储系统及方法,包括:步骤1,根据处理单元对图神经网络模型中向量数据的访存请求,判断在片上存储系统的第一级CAM结构中是否有于该访存请求对应的查询结果,若有则执行步骤2,否则判断在片上存储系统的第二级CAM结构中是否有于该访存请求对应的查询结果,若有则执行步骤2,否则根据所需的向量数据批量对片外存储器发起片外访存请求,并替换片上存储内的指定向量数据;步骤2,根据该查询结果,得到对应的SPM索引标记,利用该SPM索引标记中的Sector Index字段以向量方式访问SPM中的相应向量数据,并将该相应数据返回给处理单元。本发明能有效提升面向图神经网络应用的片上存储系统的利用率和访存通量。
-
公开(公告)号:CN113083797B
公开(公告)日:2023-01-24
申请号:CN202110337683.X
申请日:2021-03-30
Applicant: 中国科学院计算技术研究所
Abstract: 提供一种自动检测除尘装置,包括:光源,用于发射探测光;透镜,用于接收所述探测光,并发出平行光;第一光电探测器,用于接收并检测来自所述透镜的光;吸尘装置,用于吸收粉尘;除尘控制板,其被设置用于接收所述第一光电探测器的检测信息,并计算得到当前的粉尘浓度,以及当所述当前的粉尘浓度大于预设阈值时,所述除尘控制板控制所述吸尘装置启动。
-
公开(公告)号:CN115391731A
公开(公告)日:2022-11-25
申请号:CN202210921474.4
申请日:2022-08-02
Applicant: 中国科学院计算技术研究所
Abstract: 本申请公开了一种基于数据流架构的Cholesky分解加速计算方法,所述方法包括:数据准备步骤、矩阵2×2分块计算步骤及矩阵1×1分块计算步骤;将数据流架构中处理单元PE阵列分为多个PE组,将不规则的待计算矩阵按照预定划分规则划分为规则的多个矩阵块,判断规模为N×N的待计算矩阵的N大于预定阈值,则采用基于2×2分块的cholesky拆分算法,循环迭代计算各个PE组中的矩阵块,且通过不同PE组对cholesky分解计算的数据依赖关系,实现PE组间数据传递,待计算矩阵的规模动态调整缩小;判断规模为N×N的所述待计算矩阵的N小于等于预定阈值,采用基于1×1分块的cholesky拆分算法,循环迭代计算,直至计算完成输出计算结果,完成基于数据流架构的Cholesky分解的加速计算。
-
公开(公告)号:CN115390923A
公开(公告)日:2022-11-25
申请号:CN202210843537.9
申请日:2022-07-18
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出一种基于多模式的SIMD应用高效执行方法和系统,包括:一种能灵活控制SIMD部件运行在不同粒度的SIMD部件架构,使得SIMD部件可以在不同的应用,以及同应用但不同规模等场景下保持高效的利用率。以及与之相配套的搜寻应用最佳粒度并生成应用在对应粒度下的映射方案的方法,以充分发挥多模式SIMD部件的能力。这种多模式SIMD部件能够应用于多种类型的芯片当中。
-
公开(公告)号:CN115374732A
公开(公告)日:2022-11-22
申请号:CN202210880357.8
申请日:2022-07-25
Applicant: 中国科学院计算技术研究所
IPC: G06F30/33 , G06F30/3312 , G06F115/10
Abstract: 本申请公开了一种针对低温多芯片计算系统的模拟方法,方法包括:跨温区多芯片模拟通信系统搭建步骤、低温多芯片功能模拟步骤及低温多芯片时序模拟步骤;搭建相互通信连接的低温多芯片计算系统及室温数据通信系统,基于多种芯片的设计规范,行为级模拟描述低温中用于计算的多种芯片的功能以及多种芯片之间交互运行功能,并模拟多种芯片的输出执行结果;基于多种芯片的设计规范,模拟低温下各芯片内部的周期工作时序,并模拟多种芯片间的通信协议,以模拟低温多芯片计算系统的时序,并验证各个时序的正确性。本发明针对复杂的低温多芯片计算进行仿真和模拟,以便在流片前通过仿真调试及早发现系统问题并进行修改。
-
公开(公告)号:CN115296742A
公开(公告)日:2022-11-04
申请号:CN202210764461.0
申请日:2022-06-29
Applicant: 中国科学院计算技术研究所
IPC: H04B10/25
Abstract: 本发明提出一种板间通信接口系统,包括:多个光纤通信单元,多个光纤通信单元之间通过光纤互联;每一个所述光纤通信单元均配置有光纤通信模块作为通信接口,还配置有Aurora协议IP核模块,与所述光纤通信模块互联。该系统基于Aurora协议实现光纤通信互联,满足了高速率和大容量等需求,使得数据在跨板卡之间也能高效、正确传输,提高传输速率,实现了远距离数据传输,消除了在电磁环境中外部设备对超导设备造成的干扰。
-
公开(公告)号:CN115296741A
公开(公告)日:2022-11-04
申请号:CN202210764423.5
申请日:2022-06-29
Applicant: 中国科学院计算技术研究所
IPC: H04B10/25
Abstract: 本发明提出一种跨平台光纤传输系统,所述系统包括:光纤通信转接单元与串并通信单元;所述光纤通信转接单元与所述串并通信单元均配置有光纤通信模块作为通信接口,所述光纤通信转接单元与所述串并通信单元之间通过所述光纤通信模块进行数据通信;所述光纤通信转接单元与上位机之间采用基于RIFFA可重用集成架构搭建PCIe进行数据传输。该跨平台光纤传输系统,系统性能高,能够实现跨平台、多板卡之间通信。
-
公开(公告)号:CN114925826A
公开(公告)日:2022-08-19
申请号:CN202210553741.7
申请日:2022-05-20
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供一种用于分布式训练同步阶段的自动优化方法,所述方法包括在每个回合执行如下步骤:S1、获取在当前回合网络状态满足预设的系统要求的节点组成激活节点列表;S2、基于激活节点列表中的所有节点构建自动优化策略以从激活节点列表中选出使分布式系统效率最大的激活节点组合作为自动优化策略,并将自动优化策略对应的节点加入分布式训练。其中,所述激活节点列表包括当前回合已存在的激活节点列表以及当前回合新加入的新增激活节点列表,其中,所述当前回合新加入的新增激活节点列表是在当前回合网络状态满足系统要求的非激活节点组成的列表,所述非激活节点是指当前回合之前未加入分布式训练的节点。
-
-
-
-
-
-
-
-
-