-
公开(公告)号:CN113225241A
公开(公告)日:2021-08-06
申请号:CN202110417613.5
申请日:2021-04-19
Applicant: 中国科学院计算技术研究所
IPC: H04L12/42 , H04L29/08 , H04L12/801
Abstract: 本发明提出一种面向环形数据报文网络的数据传输拥塞控制方法和系统,包括主动拥塞控制技术方案,主动划定虚拟链路的最大可用带宽,使得多条虚拟链路最大化利用链路带宽的同时避免节点拥塞;以及处理链路争用的技术方案,利用计数器实现一段时间内同一节点中不同虚拟链路对发送端口TX的加权平均占用,防止链路争抢。
-
公开(公告)号:CN112114875A
公开(公告)日:2020-12-22
申请号:CN202010876462.5
申请日:2020-08-27
Applicant: 中国科学院计算技术研究所
IPC: G06F9/30
Abstract: 提供一种超导并行寄存器堆装置,该装置包括N个寄存器组,其中N为大于等于2的整数,该N个寄存器组分别包括用于接收数据输入的数据输入端,用于接收写数据地址的写地址输入端,用于接收写使能信号的写使能端,用于接收时钟信号的时钟输入端,用于接收读数据地址的读地址输入端以及用于将数据输出的数据输出端;其中,该N个寄存器组的数据输入端连接在一起,该N个寄存器组的写地址输入端连接在一起,以及该N个寄存器组的写使能端连接在一起。
-
公开(公告)号:CN112036551A
公开(公告)日:2020-12-04
申请号:CN202010995617.7
申请日:2020-09-21
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出一种一种卷积神经网络的加速方法,其特征在于,包括:步骤1、根据权值大小对权重矩阵进行降序排列,并记录降序排列前的权值索引;步骤2、利用降序排列后的权重矩阵与特征矩阵进行乘累加运算;步骤3、判断所述乘累加运算的结果是否小于零,如是,则结束运算,如否,则继续步骤2的运算,直至得出最后运算结果。本发明能够有效减少卷积神经网络中的无效计算,一方面可以提高神经网络的计算速度,提高加速器、芯片的性能;另一方面,无效计算的减少还能降低芯片的能耗。
-
公开(公告)号:CN111950215A
公开(公告)日:2020-11-17
申请号:CN202010703091.0
申请日:2020-07-21
Applicant: 中国科学院计算技术研究所
IPC: G06F30/337 , G06F30/396 , G06F111/06
Abstract: 提供一种生成面向超导RSFQ电路的多扇出时钟信号的方法,其中N是扇出时钟信号的数量,N个扇出时钟信号的每一个与从时钟源点到时钟端点所经过的由SPL构成的分支路径相对应,由SPL构成的分支路径构成SPL树,所述方法包括:建立高度P为1的SPL树,将其存入集合R;根据N计算SPL树的最大高度Pmax;自底向上逐层建立SPL树,每次迭代P增加1,直到P>Pmax,并将所得到的SPL树存入集合R中;选择所述集合R中叶节点数为N的树构成最优解;根据所述最优解确定多扇出时钟信号的由SPL构成的分支路径;其中,高度为P的树是由所述集合R中高度为P-1的子树组成的。
-
公开(公告)号:CN111737540A
公开(公告)日:2020-10-02
申请号:CN202010460064.5
申请日:2020-05-27
Applicant: 中国科学院计算技术研究所
IPC: G06F16/903 , G06F16/901
Abstract: 本发明实施例提供了一种图数据处理方法,包括:S1、获取包含多个顶点的图数据,按顶点的出度由小到大的顺序对顶点排序并将排序序号作为第一重排序ID;S2、根据第一重排序ID将图数据的顶点按预设粒度以轮询方式依次分配到分布式计算节点集群中的每一个分布式计算节点;S3、计算节点使用混合BFS算法对其获得的部分图数据进行遍历,每层遍历后各计算节点得到局部的下一层活跃顶点集;S4、每层遍历后相邻计算节点间进行环形通信以传递局部的下一层活跃顶点集,在部分层遍历后传递局部的下一层活跃顶点集之前,确定本次待传递的局部的下一层活跃顶点集的压缩方式,本发明通过顶点的出度对顶点ID进行重排序、数据压缩和环形通信,提高了通信效率。
-
公开(公告)号:CN110008436A
公开(公告)日:2019-07-12
申请号:CN201910171401.6
申请日:2019-03-07
Applicant: 中国科学院计算技术研究所
IPC: G06F17/14
Abstract: 本发明涉及一种基于数据流架构的快速傅里叶变换方法、系统和存储介质,包括:从X个源操作数中按照码位倒置顺序载入2(log2X-log2Y)个源操作数和旋转因子,Y为处理单元数,以在处理单元本地完成log2X-log2Y层蝶形运算,得到运算结果;设运算层数Q=1;将Y个处理单元标号分别对应1至Y,保存各处理单元与标号的对应关系构成序列表,序列表中有标识位,初始化所有处理单元标识位都为true;在序列表中选择标号最小且标识位为true的处理单元PEi,将其与编号为i+2Q-1的处理单元构成交换对,并将交换对中两个PE的标志位更改为false;直到所有处理单元标识位均为false,各交换对包括的处理单元间交换运算结果以完成一层蝶形运算,Q自加1;直到Q为log2X时输出运算结果。
-
公开(公告)号:CN106339350B
公开(公告)日:2019-01-11
申请号:CN201610711933.0
申请日:2016-08-23
Applicant: 中国科学院计算技术研究所 , 北京中科睿芯科技有限公司
IPC: G06F15/173
Abstract: 本发明适用于计算机技术领域,提供了一种众核处理器片上访存距离优化的方法及其装置,所述方法包括如下步骤:步骤1,当存储控制器在所述众核处理器片上n*n拓扑结构的边上时,查找所述n*n拓扑结构中离所述存储控制器距离最近的顶点;步骤2,判断(n‑1)能否被3整除,若能,则增加一条连线连接所述顶点及其所在对角线((0,0),(n‑1,n‑1))2/3的第一节点;若不能,则判断连接对应(,)的第一节点或(,)的第一节点的收益,并根据所述收益选择其中一个第一节点连接所述顶点;步骤3,将所述存储控制器与所述顶点连接。借此,本发明实现了有效减少节点和访存控制器之间的距离,从而减低众核处理器片片上网络的访存延迟。
-
公开(公告)号:CN103729248B
公开(公告)日:2017-12-15
申请号:CN201210392519.X
申请日:2012-10-16
Applicant: 华为技术有限公司 , 中国科学院计算技术研究所
IPC: G06F9/50
CPC classification number: G06F9/5088 , G06F9/4881
Abstract: 本发明公开了一种基于缓存感知的确定待迁移任务的方法,包括:根据每一个处理器核的负载确定源处理器核和目标处理器核;监测源处理器核和目标处理器核中的每一个任务的缓存失效次数和执行的指令数,得到源处理器核和目标处理器核中的每一个任务的千条指令缓存失效次数;得到源处理器核和目标处理器核的平均千条指令缓存失效次数;根据源处理器核的平均千条指令缓存失效次数和目标处理器核的平均千条指令缓存失效次数确定从所述源处理器核向所述目标处理器核迁移的任务。根据本发明实施例的确定待迁移任务的方法,可以让操作系统感知程序的行为,从而在任务迁移时选择更加合理的任务。本发明还公开了一种基于任务感知确定待迁移任务的装置。
-
公开(公告)号:CN104252392A
公开(公告)日:2014-12-31
申请号:CN201310269618.3
申请日:2013-06-28
Applicant: 华为技术有限公司 , 中国科学院计算技术研究所
CPC classification number: G06F12/0842
Abstract: 本发明实施例提供一种访问数据缓存的方法和处理器,涉及计算机领域,能够减小数据查找的范围,降低访问延迟,提高系统性能。该处理器的数据缓存器为一级缓存,一级缓存包括私有数据缓存和共享数据缓存,私有数据缓存包括多个私有缓存,私有数据缓存用于存储线程的私有数据,共享数据缓存用于存储线程之间的共享数据,当访问处理器的数据缓存器中的数据时,根据数据对应的物理地址附加的标志位确定数据的数据类型,数据类型包括私有数据和共享数据,根据访问的数据确定数据对应的线程,进而根据线程和数据类型访问线程对应的数据缓存,以获取数据缓存中的数据。本发明实施例用于划分数据缓存和访问数据缓存。
-
公开(公告)号:CN114614898B
公开(公告)日:2025-01-28
申请号:CN202210310665.7
申请日:2022-03-28
Applicant: 中国科学院计算技术研究所
IPC: H04B10/2575
Abstract: 本发明提供了一种环形拓扑网络,其中,所述网络包括多个终端节点,所有终端节点串行连接形成闭环的环形回路,上一个终端节点的输出端与下一个终端节点的输入端相连,所述每个终端节点配置有网卡设备和光模块,其中:所述光模块用于接收输入光信号,并将光信号转换为电信号进行缓存并以数据包形式发送给网卡设备,以及将需要转发的数据包转换为光信号后向外发送;所述网卡设备用于根据预先配置的转发规则将其接收到的数据包进行处理,其中,所述预先配置的转发规则包括:数据包目的地址为本机时将其发送给所在的主机进行保存、数据包目的地址为非本机时将其发送给光模块进行转发、数据包源地址为本机时将其丢弃。
-
-
-
-
-
-
-
-
-