-
公开(公告)号:CN116710912A
公开(公告)日:2023-09-05
申请号:CN202180089847.X
申请日:2021-04-26
Applicant: 华为技术有限公司
IPC: G06F17/16
Abstract: 一种矩阵乘法器及矩阵乘法器的控制方法,涉及计算机技术领域,该矩阵乘法器包括运算电路(403)和控制器(404)。其中,运算电路(403)与控制器(404)连接,控制器(404)用于控制运算电路(403)在n个连续时钟周期内复用一个左分形矩阵Asr,同时控制运算电路(403)在该n个连续时钟周期的每个时钟周期内使用n个右分形矩阵中的一个右分形矩阵Brt。运算电路(403)用于在n个连续的时钟周期中的每个时钟周期内,将左分形矩阵与n个右分形矩阵中的一个右分形矩阵进行相乘,以得到n个矩阵运算结果。
-
公开(公告)号:CN114254255A
公开(公告)日:2022-03-29
申请号:CN202011025367.0
申请日:2020-09-25
Applicant: 华为技术有限公司
Abstract: 本申请实施例公开了一种卷积计算方法,本申请实施例方法包括:数据处理设备获取卷积核数据,并生成目标空间矩阵,数据处理设备根据中间矩阵的子单元组合关系生成卷积结果,中间矩阵通过目标空间矩阵和参考矩阵计算得到,参考矩阵指示图片的像素信息,中间矩阵的子单元组合关系为在计算卷积结果的过程中,中间矩阵的各子单元间的关系。根据中间矩阵的子单元组合关系生成卷积结果大大减少了内部存储空间的占用。
-
公开(公告)号:CN114254255B
公开(公告)日:2025-01-17
申请号:CN202011025367.0
申请日:2020-09-25
Applicant: 华为技术有限公司
Abstract: 本申请实施例公开了一种卷积计算方法,本申请实施例方法包括:数据处理设备获取卷积核数据,并生成目标空间矩阵,数据处理设备根据中间矩阵的子单元组合关系生成卷积结果,中间矩阵通过目标空间矩阵和参考矩阵计算得到,参考矩阵指示图片的像素信息,中间矩阵的子单元组合关系为在计算卷积结果的过程中,中间矩阵的各子单元间的关系。根据中间矩阵的子单元组合关系生成卷积结果大大减少了内部存储空间的占用。
-
公开(公告)号:CN110929854B
公开(公告)日:2024-04-16
申请号:CN201811100198.5
申请日:2018-09-20
Applicant: 华为技术有限公司
Abstract: 本申请提供一种数据处理方法、装置及硬件加速器。该数据处理方法包括:处理器获取第一矩阵和第二矩阵,根据第二矩阵中的非零元素和硬件加速器的规格,得到至少一个第三矩阵和至少一个索引信息;硬件加速器根据第三矩阵对应的索引信息,从第一矩阵中对应的l行中获取第四矩阵,根据第四矩阵和第三矩阵得到第五矩阵,根据至少一个第五矩阵得到目标结果。由于处理器剔除了第二矩阵的n列中的部分或全部零元素得到第三矩阵,第三矩阵参与运算的零元素数量比第二矩阵的n列中的零元素数量小,及根据索引信息得到的第四矩阵的元素数量较小,可通过减少参与运算的零元素的数量达到减少硬件加速器总运算量的目的,以提高硬件加速器的运算效率。
-
公开(公告)号:CN119155576A
公开(公告)日:2024-12-17
申请号:CN202310710329.6
申请日:2023-06-14
Applicant: 华为技术有限公司
IPC: H04Q11/00
Abstract: 一种路径确定方法、装置及系统,属于通信技术领域。所述方法包括:第一控制器确定端口组集合后,并行确定端口组集合中各个端口组对应的路径,以及在交换网络中位于已确定出的路径之外的部分中,确定未确定出对应的路径的端口组所对应的路径。上述端口组包括:待交换数据的一个第一端口和一个第二端口,且不同端口组中的第一端口和第二端口均不同;端口组集合包括:第一端口和第二端口均属于不同交换结构的至少两个端口组;任一端口组对应的路径为:该端口组中第一端口和第二端口之间的路径;并且,不同端口组对应的路径相互独立。本申请可以解决控制器确定路径的方式较为单一的问题,本申请用于路径的确定。
-
公开(公告)号:CN110929854A
公开(公告)日:2020-03-27
申请号:CN201811100198.5
申请日:2018-09-20
Applicant: 华为技术有限公司
Abstract: 本申请提供一种数据处理方法、装置及硬件加速器。该数据处理方法包括:处理器获取第一矩阵和第二矩阵,根据第二矩阵中的非零元素和硬件加速器的规格,得到至少一个第三矩阵和至少一个索引信息;硬件加速器根据第三矩阵对应的索引信息,从第一矩阵中对应的l行中获取第四矩阵,根据第四矩阵和第三矩阵得到第五矩阵,根据至少一个第五矩阵得到目标结果。由于处理器剔除了第二矩阵的n列中的部分或全部零元素得到第三矩阵,第三矩阵参与运算的零元素数量比第二矩阵的n列中的零元素数量小,及根据索引信息得到的第四矩阵的元素数量较小,可通过减少参与运算的零元素的数量达到减少硬件加速器总运算量的目的,以提高硬件加速器的运算效率。
-
-
-
-
-