-
公开(公告)号:CN119356738A
公开(公告)日:2025-01-24
申请号:CN202411452516.X
申请日:2024-10-17
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供了一种基于混合积的任务处理方法及计算装置,该方法包括:获取计算任务所需的第一矩阵A、第二矩阵B和第三矩阵C,计算任务是求AB+C的结果矩阵D的矩阵乘加运算;获取硬件规模t;根据硬件规模和预设的划分规则,将A、B和C分别划分为适于处理阵列处理的四级子矩阵,包括第一、第二、第三和第四级子矩阵;利用处理阵列根据划分出的子矩阵进行混合积运算以完成任务,其中,混合积运算过程中,在第四级子矩阵的维度上采用哈达玛积的形式进行计算,在第三级子矩阵的维度上采用矩阵的外积的形式进行计算,在第二级子矩阵的维度上采用矩阵的外积的形式进行计算,在第一级子矩阵的维度上采用内积的形式进行计算。
-
公开(公告)号:CN119226225A
公开(公告)日:2024-12-31
申请号:CN202411288815.4
申请日:2024-09-14
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供了一种数据流可重构架构中单元失效的自感知方法,所述数据流可重构架构是指能按照任务的数据流对处理单元进行组织和管理的CGRA架构,所述数据流可重构架构包括自感知控制器和多个处理单元,每个处理单元包括计算部件、路由部件和存储部件,路由部件包括控制路由和数据路由,每个部件均设有感知模块,所述方法包括:由所述自感知控制器向处理单元发出检测请求;由处理单元中的各个感知模块根据检测请求分别检测计算部件、存储部件、控制路由和数据路由是否正常,得到检测结果;由自感知控制模块收集各个处理单元反馈的检测结果。
-
公开(公告)号:CN119166218A
公开(公告)日:2024-12-20
申请号:CN202411190236.6
申请日:2024-08-28
Applicant: 中国科学院计算技术研究所
Abstract: 本发明实施例提供一种基于RISC‑V扩展指令的矩阵及向量运算装置,所述装置包括相互连接的协处理器与主处理器,主处理器中配置有RISC‑V指令集和协处理器扩展指令集,RISC‑V指令集包括与向量运算任务相关的向量扩展指令集,协处理器扩展指令集包括与矩阵运算任务相关的矩阵处理指令集,主处理器被配置为:在执行计算任务时,将与矩阵运算任务相关的矩阵处理指令集或将与向量运算任务相关的向量扩展指令集发送给协处理器,以与协处理器并行执行计算任务;协处理器被配置为:根据所述矩阵扩展指令集执行主处理器卸载下的矩阵运算任务,得到矩阵运算任务的执行结果;或者根据所述向量扩展指令集执行主处理器卸载下的向量运算任务,得到向量运算任务的执行结果。
-
公开(公告)号:CN119065832A
公开(公告)日:2024-12-03
申请号:CN202411019358.9
申请日:2024-07-29
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供了一种面向数据流众核处理器的任务运行时调度方法及装置,该方法包括在运行时环境中执行以下操作:根据PE阵列的剩余资源、片上存储空间剩余资源和各任务的属性信息,从任务发射队列中标记资源适配的任务以构建任务组;对任务组中的任务进行预处理,得到经预处理的任务组,将经预处理的任务组映射到PE阵列上执行,其中,所述预处理包括:识别任务组中具有数据依赖的两个任务构成的关联对,修改关联对中前驱任务和后继任务所对应的微指令代码,以使处理该前驱任务的PE核将结果数据直接传输至处理该后继任务的PE核。
-
公开(公告)号:CN118866899A
公开(公告)日:2024-10-29
申请号:CN202411038738.7
申请日:2024-07-31
Applicant: 中国科学院计算技术研究所
IPC: H01L27/02 , G06F15/173 , G06F15/78 , G06F13/40 , G06N3/063
Abstract: 本发明提出一种基于共性I/O模组的芯粒集成方法,包括:设置功能模组,该功能模组包括功能I/O接口;设置I/O模组,该I/O模组包括内部I/O接口和外部标准I/O接口;将该功能I/O接口与该内部I/O接口电性连接;将该功能模组与该I/O模组设置于标准模组空间,封装为芯粒,并以该外部标准I/O接口为该芯粒的对外I/O接口。本发明还提出一种采用基于共性I/O模组的芯粒集成方法进行芯粒集成的芯粒。
-
公开(公告)号:CN114742642B
公开(公告)日:2024-07-23
申请号:CN202210437977.4
申请日:2022-04-20
Applicant: 中国科学院计算技术研究所
Abstract: 本发明实施例提供了一种用于资金网络的图数据处理方法,包括:获取与所述资金网络相关的图数据,其中,所述图数据包括节点和边,其中节点表示用户,边表示资金流向以及资金数额;根据图数据中的每条边构建与之方向相反的虚边;获取图数据的源节点以及用于限定所需资金环路要求的约束参数,从源节点开始根据图数据中的边和约束参数进行正向遍历以及根据图数据中的虚边和约束参数进行反向遍历;基于正向遍历和反向遍历的结果,确定图数据中存在的资金环路;本发明可以高效地确定图数据满足所需资金环路要求的资金环路。进而基于确定的资金环路对资金网络中的风险,如洗钱、信用卡诈骗等,进行把控。
-
公开(公告)号:CN114968873B
公开(公告)日:2024-04-05
申请号:CN202210514890.2
申请日:2022-05-11
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供一种PCIE数据交换装置,包括:至少两路PCIE的交换结构,每路交换结构至少设有用于连接相应主机的上行通道、上行接口以及用于连接扩展设备的下行通道、下行接口;多个选通开关部件,其设于每路交换结构的至少部分下行通道上以及至少部分上行通道上,用于切换扩展设备的数据传输所经由的交换结构;通路控制部件,被配置为根据每路交换结构的工作状态确定选通开关部件选通的通路,以在其中一路交换结构处于故障状态时将其对应的扩展设备转由处于正常状态的其他交换结构连接至对应的主机;本发明可以在保障业务的连续性、系统的可靠性的情况下,同时提高资源利用率。
-
公开(公告)号:CN112215349B
公开(公告)日:2024-01-12
申请号:CN202010972552.4
申请日:2020-09-16
Applicant: 中国科学院计算技术研究所
IPC: G06N3/082 , G06N3/0464
Abstract: 本发明提供一种基于数据流架构的稀疏卷积神经网络加速方法,其包括:通过计算输入激活和权值矩阵的运算,得到输出激活的正负值标记信息;根据所述输出激活的正负值标记信息,对与所述输出激活相关的指令的有效与无效进行标记,得到指令标记信息;根据所述指令标记信息,筛选出所述指令中被标记为有效的指令;跳过所述被标记为无效的指令,仅执行所述被标记为有效的指令。
-
公开(公告)号:CN112015472B
公开(公告)日:2023-12-12
申请号:CN202010685107.X
申请日:2020-07-16
Applicant: 中国科学院计算技术研究所
IPC: G06F9/30 , G06F9/32 , G06N3/10 , G06N3/0464 , G06N3/0495 , G06N3/082
Abstract: 本发明提出一种数据流架构中无效指令检测并跳过执行的方法,适用于数据流架构下稀疏卷积神经网络的加速。该发明对于稀疏神经网络,包括卷积层和全连接层。通过对编译器编译的指令,依据数据特征生成指令标记信息,指令检测单元又依据指令标记信息对指令进行检测,并跳过无效指令的执行,从而实现稀疏卷积神经网络的加速。
-
公开(公告)号:CN116303226A
公开(公告)日:2023-06-23
申请号:CN202310159302.2
申请日:2023-02-14
Applicant: 中国科学院计算技术研究所
IPC: G06F15/78
Abstract: 本发明提出一种粗粒度可重构阵列数据流处理器的高效执行方法和系统,包括:待执行程序的有向数据流图中节点为代码段,连线为节点间依赖关系;粗粒度可重构阵列数据流处理器的PE从全局缓存中加载每个节点的配置信息、操作指令和操作数;调度前继依赖已满足的节点作为当前节点开始执行,并将当前节点的代码段分为多个执行阶段;调度当前节点的下个循环开始执行,执行时监测当前节点的下个阶段对应的粗粒度可重构阵列数据流处理器部件已经空闲,则当前节点进入下一个执行阶段,并用粗粒度可重构阵列数据流处理器部件执行其下一个执行阶段;运行完有向数据流图中所有节点的循环后,从粗粒度可重构阵列数据流处理器的全局缓存中输出当前运行结果。
-
-
-
-
-
-
-
-
-