-
公开(公告)号:CN118132462A
公开(公告)日:2024-06-04
申请号:CN202410263613.8
申请日:2024-03-08
Applicant: 中国科学院计算技术研究所
IPC: G06F12/0811 , G06F12/0866 , G06F15/78
Abstract: 本发明提供了一种数据流众核处理器的数据预取方法及处理器,方法包括:对于待执行的程序,将程序执行所需的数据划分为可预取数据和不可预取数据;对于可预取数据,在程序执行前加载至处理器的片上存储,且在程序执行前将片上存储中存有所述可预取数据的缓存路设为不可被覆盖的只读状态;对于不可预取数据,在程序执行过程中按需加载至片上存储,有效地减少了对片外存储的访问请求次数,降低了平均访问延迟;并且在程序执行前将片上存储中存有所述可预取数据的缓存路设为不可被覆盖的只读状态,使得可预取数据在程序执行完毕前被稳定地保持在片上存储中。
-
公开(公告)号:CN112288085B
公开(公告)日:2024-04-09
申请号:CN202011147836.6
申请日:2020-10-23
Applicant: 中国科学院计算技术研究所
IPC: G06N3/082 , G06N3/0464
Abstract: 本发明提出一种卷积神经网络加速方法及系统,包括将待特征分析的图像作为输入激活输入卷积神经网络,分解该卷积神经网络中滤波器的权值向量,得到滤波器中权值对应的符号向量;通过符号向量与输入激活向量执行卷积运算,得到第一卷积结果,通过补偿因子与输入激活向量执行卷积运算,得到第二卷积结果,将该第一卷积结果和第二卷积结果相加,得到预测结果;该卷积神经网络执行卷积计算时根据该预测结果跳过0值相关的运算,得到卷积结果。本发明可预知输出激活的稀疏度,以指导原始的神经网络运算跳过0值相关的运算,从而减少原始网络的计算量,节省计算资源、降低功耗并提升性能。
-
公开(公告)号:CN114416618B
公开(公告)日:2024-03-12
申请号:CN202111553453.3
申请日:2021-12-17
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出一种三维芯片,包括:多个堆叠的芯片层,每个该芯片层包括至少一个芯片;层间通信模块;该芯片与该层间通信模块通过硅通孔通信连接;第一芯片层的发送芯片通过该层间通信模块向第二芯片层的接收芯片发送数据信息。还提出一种三维芯片的芯片间通信方法,包括:当第一芯片层的发送芯片拟向第二芯片层的接收芯片发送数据信息时,由该发送芯片向层间通信模块发送握手信息,该握手信息中包括该接收芯片的芯片地址;由该层间通信模块根据该芯片地址,以该握手信息进行该发送芯片与该接收芯片之间的握手操作;根据握手结果,由该层间通信模块接收该数据信息并传输至该接收芯片。
-
公开(公告)号:CN113127404B
公开(公告)日:2024-03-08
申请号:CN202110430491.3
申请日:2021-04-21
Applicant: 中国科学院计算技术研究所
IPC: G06F15/173 , G06F15/177
-
公开(公告)号:CN114610138B
公开(公告)日:2023-08-08
申请号:CN202210230341.2
申请日:2022-03-10
Applicant: 中国科学院计算技术研究所
IPC: G06F1/3234 , G06F1/3206
Abstract: 提供一种带宽控制单元,其用于包括多个数据处理单元的处理器芯片,所述多个数据处理单元通过总线对存储器进行访问,所述存储器包括优先级管理单元,所述带宽控制单元包括:第一温度判断模块,其用于接收所述多个数据处理单元的温度值,以及将所述温度值分别与相应的数据处理单元的温度阈值进行比较,并输出第一比较结果;以及优先级处理模块,其用于接收所述第一比较结果,以及根据所述第一比较结果调整所述多个数据处理单元中的一个或者多个的访存优先级;其中,所述优先级处理模块将调整后的访存优先级输出至所述存储器的优先级管理单元,以控制所述多个数据处理单元访存所述存储器的带宽。
-
公开(公告)号:CN113298236B
公开(公告)日:2023-07-21
申请号:CN202110676008.X
申请日:2021-06-18
Applicant: 中国科学院计算技术研究所
IPC: G06N3/0464 , G06N3/063
Abstract: 本发明提供一种基于数据流结构的低精度神经网络计算装置,包括输入缓存区,输出缓存区、权重缓存区以及PE阵列,其中,PE阵列中的每个PE包括乘加部件,所述乘加部件以SIMD方式进行乘加运算。本发明还提供一种基于上述装置的低精度神经网络加速方法。本发明节省了计算资源,减少了访存带来的开销。
-
公开(公告)号:CN112015473B
公开(公告)日:2023-06-27
申请号:CN202010719417.9
申请日:2020-07-23
Applicant: 中国科学院计算技术研究所
IPC: G06F9/30 , G06F9/32 , G06N3/10 , G06N3/0464 , G06N3/0495 , G06N3/082
Abstract: 本发明提出一种基于数据流架构的稀疏卷积神经网络加速方法及系统。针对稀疏卷积应用,使用软件方式设计了一套指令共享检测装置和稀疏卷积加速方法。通过对编译器生成的指令进行检测和对比,标记所有指令中指令内容完全相同的指令,将这些指令的地址设置为相同的地址,实现稀疏卷积中指令共享,从而减少了指令加载对内存的访问,提升了稀疏卷积运行的时间。
-
公开(公告)号:CN111694643B
公开(公告)日:2023-04-11
申请号:CN202010395810.7
申请日:2020-05-12
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出一种面向图神经网络应用的任务调度执行系统及方法,包括:待发射图运算符缓存模块读取待处理图运算符处理请求,根据待处理图运算符处理请求的图运算符标签,从缓存中获取所需输入数据;发射单元将待处理图运算符处理请求和输入数据发送给基于静态数据流的统一结构处理单元;统一结构处理单元根据图运算符标签的图运算符码将输入数据映射到相应的二叉运算树的输入上和图运算符执行帧,并完成本轮运算,得到中间结果;标签生成器依据前一轮运算标签信息,生成新的图运算符标签;统一结构处理单元将中间结果以及新的图运算符标签返回给待发射图运算符缓存模块;循环执行直至图运算符标签中剩余重复次数数值为1,将当前中间结果写回缓存。
-
公开(公告)号:CN115686639A
公开(公告)日:2023-02-03
申请号:CN202211290962.6
申请日:2022-10-21
Applicant: 中国科学院计算技术研究所
IPC: G06F9/38
Abstract: 本发明提供了一种应用于处理器的分支预测方法以及分支预测器,该分支预测方法包括:获取TAGE预测器对分支指令进行分支预测的第一中间参数以及第一预测值;获取GEHL预测器对所述分支指令进行分支预测的第二中间参数以及第二预测值;利用预设的组合预测器根据所述分支指令对应的PC值、第一中间参数、第一预测值、第二中间参数以及第二预测值中的指定比特位按照预定的规则重组确定多个子索引,并基于重组的多个子索引确定对应的第三预测值以及第三预测值的置信度;根据所述分支指令对应的PC值、第三预测值以及第三预测值的置信度生成查询索引,利用所述查询索引从预定的模式历史表中确定分支指令对应的最终预测值,从而提升分支预测的精度和处理器效率。
-
公开(公告)号:CN115600658A
公开(公告)日:2023-01-13
申请号:CN202211208844.6
申请日:2022-09-30
Applicant: 中国科学院计算技术研究所(CN)
IPC: G06N3/0464 , G06N3/082 , G06N3/047
Abstract: 本发明提供一种应用于图神经网络训练的采样方法,用于在图神经网络训练过程中对图数据进行采样,所述采样方法包括:获取图数据中每个节点的所有邻居节点的存储位置,并以节点的所有邻居节点的存储位置随机排序构成该节点对应的邻居节点序列;基于得到的每个节点对应的邻居节点序列判断该节点的所有邻居节点是否符合集中分布;根据得到的每个节点的邻居节点的判断结果调整该节点被采样的概率,其中,将对应邻居节点符合集中的节点被采样的概率提高,将对应邻居节点不符合集中分布的节点被采样的概率降低;采用调整后的每个节点被采样的概率形成的概率分布对图数据进行采样。本发明减少了采样过程中的访存开销。
-
-
-
-
-
-
-
-
-