-
公开(公告)号:CN116097213B
公开(公告)日:2025-04-08
申请号:CN202080104044.2
申请日:2020-08-24
Applicant: 华为技术有限公司
IPC: G06F9/34
Abstract: 一种图指令处理方法及装置,涉及计算机技术领域,用于提高有向图流计算架构的性能。该方法应用于处理器中,包括:检测第一图指令的第一输入和第二输入是否处于准备完成状态,第一输入和/或所述第二输入为所述第一图指令的动态数据输入(S301);当第一输入和第二输入均处于准备完成状态时,从第一寄存器中获取第一图指令的静态数据输入信息,该静态数据输入信息用于指示至少一个输入(S302),至少一个输入中的每个输入为常量输入或者暂时常量输入;根据第一输入、第二输入和该至少一个输入处理第一图指令,得到第一处理结果(S303)。
-
公开(公告)号:CN116097213A8
公开(公告)日:2023-06-30
申请号:CN202080104044.2
申请日:2020-08-24
Applicant: 华为技术有限公司
IPC: G06F9/34
Abstract: 一种图指令处理方法及装置,涉及计算机技术领域,用于提高有向图流计算架构的性能。该方法应用于处理器中,包括:检测第一图指令的第一输入和第二输入是否处于准备完成状态,第一输入和/或所述第二输入为所述第一图指令的动态数据输入(S301);当第一输入和第二输入均处于准备完成状态时,从第一寄存器中获取第一图指令的静态数据输入信息,该静态数据输入信息用于指示至少一个输入(S302),至少一个输入中的每个输入为常量输入或者暂时常量输入;根据第一输入、第二输入和该至少一个输入处理第一图指令,得到第一处理结果(S303)。
-
公开(公告)号:CN111859273A
公开(公告)日:2020-10-30
申请号:CN202010493191.5
申请日:2017-12-29
Applicant: 华为技术有限公司
IPC: G06F17/16
Abstract: 本发明实施例公开了一种矩阵转乘法器,涉及数据计算技术领域,旨在对两个矩阵进行分块计算。该矩阵乘法器包括:第一存储器、第二存储器、运算电路和控制器,其中,运算电路与第一存储器和第二存储器可以通过总线进行数据通信,控制器用于依据预设的程序或者指令控制第一矩阵和第二矩阵进行分块,并控制运算电路根据控制器的分块结果对第一存储器和第二存储器中的对应分块进行乘法运算。该矩阵乘法器可以用于对两个矩阵进行相乘运算。
-
公开(公告)号:CN120051765A
公开(公告)日:2025-05-27
申请号:CN202280101110.X
申请日:2022-10-25
Applicant: 华为技术有限公司
IPC: G06F9/06
Abstract: 本申请实施例公开了一种块指令的处理方法和块指令处理器,其中,该块指令包括块头和块体。该方法包括:获取第i个块头;基于第i个块头指示的第一信息,将第i个块头分发至第j个块执行单元上;第i个块头指示的第一信息包括第i个块头对应的第i个块指令的输入寄存器信息和输出寄存器信息;通过所述第j个块执行单元,基于所述第i个块头指示的第二信息,获取第i个块体;所述第i个块体对应所述第i个块指令的块体;所述第i个块头指示的第二信息包括所述第i个块体的存储位置;i为大于1的整数,j为大于或者等于1的整数;执行第i个块体中包括的N条微指令,N为大于或者等于1的整数。采用本申请实施例可以有效提升块指令的执行效率。
-
公开(公告)号:CN117539545A
公开(公告)日:2024-02-09
申请号:CN202210924615.8
申请日:2022-08-02
Applicant: 华为技术有限公司
IPC: G06F9/38
Abstract: 本申请实施例提供了一种指令执行的方法,其中,该方法包括:确定队列中第一块的执行状态为完成状态,所述队列包括多个块,所述第一块为所述队列中编号最小的块,所述第一块包括至少一个指令;根据所述第一块中指令的执行结果改变处理器的状态;将所述第一块从所述队列中删除。本申请技术方案能够将结构化指令集架构应用在处理器中,解决低层级指令阻塞硬件资源的问题,提高程序的运行效率。
-
公开(公告)号:CN115668142A
公开(公告)日:2023-01-31
申请号:CN202080101335.6
申请日:2020-05-30
Applicant: 华为技术有限公司
IPC: G06F9/46
Abstract: 本申请公开了一种处理器、处理方法及相关设备,其中,处理器包括处理器核,所述处理器核包括指令调度单元、与所述指令调度单元连接的图计算流单元和至少一个通用运算单元;其中,所述指令调度单元,用于:将解码后的待执行指令中通用计算指令分配给所述至少一个通用计算单元,以及将所述解码后的待执行指令中图计算控制指令分配给所述图计算单元,所述通用计算指令用于指示执行通用计算任务,所述图计算控制指令用于指示执行图计算任务;所述至少一个通用运算单元,用于执行所述通用计算指令;所述图计算流单元,用于执行所述图计算控制指令。采用本申请,可以提升处理器的处理效率。
-
公开(公告)号:CN109992743B
公开(公告)日:2020-06-16
申请号:CN201711499179.X
申请日:2017-12-29
Applicant: 华为技术有限公司
IPC: G06F17/16
Abstract: 本发明实施例公开了一种矩阵转乘法器,涉及数据计算技术领域,旨在对两个矩阵进行分块计算。该矩阵乘法器包括:第一存储器、第二存储器、运算电路和控制器,其中,运算电路与第一存储器和第二存储器可以通过总线进行数据通信,控制器用于依据预设的程序或者指令控制第一矩阵和第二矩阵进行分块,并控制运算电路根据控制器的分块结果对第一存储器和第二存储器中的对应分块进行乘法运算。该矩阵乘法器可以用于对两个矩阵进行相乘运算。
-
公开(公告)号:CN108664447A
公开(公告)日:2018-10-16
申请号:CN201710211498.X
申请日:2017-03-31
Applicant: 华为技术有限公司
IPC: G06F17/16
Abstract: 本发明实施例公开了一种矩阵与矢量的乘法运算方法及装置,所述方法包括:获取矩阵元素的第一指示信息;根据所述第一指示信息从所述预置矩阵中读取非零元素的矩阵元素值,并确定读取的所述矩阵元素值的第一位置标码;获取矢量元素的第二指示信息;根据所述第二指示信息从输入矢量数据中读取与所述第一位置标码对应的第二位置标码的矢量元素值;获取所述矩阵元素值与所述矢量元素值的乘法运算值。采用本发明实施例,具有可降低数据处理的复杂度,降低数据处理的功耗,提高数据处理效率的优点。
-
公开(公告)号:CN111859273B
公开(公告)日:2025-01-21
申请号:CN202010493191.5
申请日:2017-12-29
Applicant: 华为技术有限公司
IPC: G06F17/16
Abstract: 本发明实施例公开了一种矩阵转乘法器,涉及数据计算技术领域,旨在对两个矩阵进行分块计算。该矩阵乘法器包括:第一存储器、第二存储器、运算电路和控制器,其中,运算电路与第一存储器和第二存储器可以通过总线进行数据通信,控制器用于依据预设的程序或者指令控制第一矩阵和第二矩阵进行分块,并控制运算电路根据控制器的分块结果对第一存储器和第二存储器中的对应分块进行乘法运算。该矩阵乘法器可以用于对两个矩阵进行相乘运算。
-
公开(公告)号:CN116113940A8
公开(公告)日:2024-05-21
申请号:CN202080104160.4
申请日:2020-08-21
Applicant: 华为技术有限公司
IPC: G06F16/901
Abstract: 一种图计算装置(11)、处理方法及相关设备,其中的图计算装置(11)包括至少一个处理引擎PE(101),至少一个处理引擎PE(101)中的每一个处理引擎PE(101)包括M个状态缓冲区(1011-1、1011-2、……、1011-M)、仲裁逻辑单元(1012)和X个运算单元(1013-1、1013-2、……、1013-X);其中,M个状态缓冲区(1011-1、1011-2、……、1011-M)中的每个状态缓冲区(1011),用于存储一次迭代计算任务的状态数据;仲裁逻辑单元(1012),用于基于M个状态缓冲区(1011-1、1011-2、……、1011-M)中的状态数据,确定当前时钟周期待执行的L条图计算指令,并将L条图计算指令分配至X个运算单元(1013-1、1013-2、……、1013-X);X个运算单元(1013-1、1013-2、……、1013-X)中的每个运算单元(1013),用于执行仲裁逻辑单元(1012)分配的图计算指令。该图计算装置(11)可以提升处理器(10)的性能。
-
-
-
-
-
-
-
-
-