-
公开(公告)号:CN114896070A
公开(公告)日:2022-08-12
申请号:CN202210617292.8
申请日:2022-06-01
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供了一种用于深度学习任务的GPU资源分配方法,包括:获取深度学习任务对应的网络结构特征、执行特征及可用资源集;基于利用率预测模型根据网络结构特征、执行特征对深度学习任务的资源利用率进行预测,得到资源利用率集;基于资源利用率集从可用资源集中确定满足深度学习任务的资源需求的所有工作节点并且根据预定的选择规则从所有工作节点中选择一个工作节点为深度学习任务分配资源,并将深度学习任务及其资源需求发送给所选择的工作节点。本发明的技术方案通过对深度学习任务的资源需求量进行预测,根据预测的资源需求量来对容器云集群中的GPU资源进行合理分配,从而实现容器云集群中的GPU资源共享以及提升容器云集群中的GPU利用率。
-
公开(公告)号:CN113451260A
公开(公告)日:2021-09-28
申请号:CN202110612403.1
申请日:2021-06-02
Applicant: 中国科学院计算技术研究所
IPC: H01L23/50 , H01L25/065 , H01L21/768
Abstract: 本发明提出一种基于系统总线的三维芯片及其三维化方法,包括至少两片同构逻辑芯片,且该同构逻辑芯片间相互垂直堆叠,同构逻辑芯片间的各个模块相互重合;每片同构逻辑芯片内部的系统总线与相邻其同构逻辑芯片内部的系统总线相连。本发明通过上述结构实现同构芯片之间的通信,以实现芯片的3D化。
-
公开(公告)号:CN113313251A
公开(公告)日:2021-08-27
申请号:CN202110522385.8
申请日:2021-05-13
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出一种基于数据流架构的深度可分离卷积融合方法和系统,包括:将输入图像数据、卷积参数从主存DRAM搬运到数据缓存SPM;PE阵列通过从数据缓存SPM中读取该输入图像数据、卷积参数,以执行DW卷积,并将得到的DW卷积结果存储在PE内的寄存器中;PE阵列对寄存器中DW卷积结果进行激活计算得到该输入图像数据的初步结果Act_out,将该初步结果Act_out写回数据缓存SPM后,进一步存回主存;PE阵列通过从数据缓存SPM中读取初步结果Act_out与卷积参数,执行PW卷积得到最终结果Output;将最终结果Output写回数据缓存SPM后,进一步存回主存DRAM。本发明减少了数据的存储与访问带来的开销,使得深度可分离式卷积计算在数据流架构上的计算实现加速。
-
公开(公告)号:CN113298236A
公开(公告)日:2021-08-24
申请号:CN202110676008.X
申请日:2021-06-18
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供一种基于数据流结构的低精度神经网络计算装置,包括输入缓存区,输出缓存区、权重缓存区以及PE阵列,其中,PE阵列中的每个PE包括乘加部件,所述乘加部件以SIMD方式进行乘加运算。本发明还提供一种基于上述装置的低精度神经网络加速方法。本发明节省了计算资源,减少了访存带来的开销。
-
公开(公告)号:CN113297131A
公开(公告)日:2021-08-24
申请号:CN202110660411.3
申请日:2021-06-15
Applicant: 中国科学院计算技术研究所
IPC: G06F15/82 , G06F15/173
Abstract: 本发明提供一种基于路由信息的数据流指令映射方法,包括:步骤M1,遍历数据流图的节点,对节点进行标号;步骤M2,依节点标号顺序以及PE阵列的PE状态表,对所述数据流图进行n层节点搜索,选取路由代价最小的方式对节点指令进行映射。本发明还提供基于路由信息的数据流指令映射系统。
-
公开(公告)号:CN113083797A
公开(公告)日:2021-07-09
申请号:CN202110337683.X
申请日:2021-03-30
Applicant: 中国科学院计算技术研究所
Abstract: 提供一种自动检测除尘装置,包括:光源,用于发射探测光;透镜,用于接收所述探测光,并发出平行光;第一光电探测器,用于接收并检测来自所述透镜的光;吸尘装置,用于吸收粉尘;除尘控制板,其被设置用于接收所述第一光电探测器的检测信息,并计算得到当前的粉尘浓度,以及当所述当前的粉尘浓度大于预设阈值时,所述除尘控制板控制所述吸尘装置启动。
-
公开(公告)号:CN112861154A
公开(公告)日:2021-05-28
申请号:CN202110209198.4
申请日:2021-02-24
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供一种面向数据流架构的SHA算法执行方法,对于逻辑左移操作,依次处理数据分量n1到数据分量nI。该方法包括:对于寄存器i的数据分量ni,将其与高位为j个1的K位二进制数1...1000...00进行按位与操作;将按位与操作的结果逻辑右移K-j位,得到寄存器i+1的进位值,并存入寄存器i的输出值REG_OUT中;将寄存器i的数据分量ni左移j位后加上寄存器i-1向寄存器i的进位值REG_IN,得到寄存器i的结果值;依次在寄存器1到寄存器I中分别重复执行上述步骤。
-
公开(公告)号:CN112215349A
公开(公告)日:2021-01-12
申请号:CN202010972552.4
申请日:2020-09-16
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供一种基于数据流架构的稀疏卷积神经网络加速方法,其包括:通过计算输入激活和权值矩阵的运算,得到输出激活的正负值标记信息;根据所述输出激活的正负值标记信息,对与所述输出激活相关的指令的有效与无效进行标记,得到指令标记信息;根据所述指令标记信息,筛选出所述指令中被标记为有效的指令;跳过所述被标记为无效的指令,仅执行所述被标记为有效的指令。
-
公开(公告)号:CN111738703A
公开(公告)日:2020-10-02
申请号:CN202010474004.9
申请日:2020-05-29
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供一种加速安全散列算法的加速器,包括:存储模块、PE运算模块、任务划分模块、算法映射模块。本发明相比于现有技术,首先可以降低计算的时间开销,提高计算性能;其次,可以降低计算带来的功耗开销;此外,本发明可以实现安全散列函数的高通量计算,显著提高哈希率,使用本发明设计的计算机系统具有良好的可扩展性和兼容性。
-
公开(公告)号:CN110941451A
公开(公告)日:2020-03-31
申请号:CN201911011823.3
申请日:2019-10-23
Applicant: 中国科学院计算技术研究所
IPC: G06F9/38
Abstract: 本发明涉及一种数据流处理器指令映射方法,包括:根据数据流图,对初始指令序列进行广度优先遍历的排序,得到按照深度优先排序的最终指令序列;将该最终指令序列划分为多个指令子序列,对所有该指令子序列依次进行指令映射,生成多个子映射布局;合并所有该子映射布局为用于数据流处理器执行该初始指令序列的最终映射布局。本发明的指令映射方法处理平衡网络拥塞度、网络负载、PE间流水、负载均衡等各种因素之外,还通过划分指令子空间的方式,分组并行进行映射布局的探索,从中选择最优的结果作为最终的映射布局,这种方式保证了映射质量的同时增加了算法的并行性,提高同等映射质量下的算法运行速度。
-
-
-
-
-
-
-
-
-