-
公开(公告)号:CN116775277A
公开(公告)日:2023-09-19
申请号:CN202310588572.5
申请日:2019-09-10
Applicant: 华为技术有限公司 , 中国科学院计算技术研究所
Abstract: 本申请公开优化张量计算性能的方法及装置,涉及深度学习技术领域,有助于加快待执行任务的执行速度,从而有助于提升张量计算的整体性能。该方法包括:第一处理器接收待执行任务的第一代码,待执行任务是对至少一个输入张量进行第一算子和第二算子的运算的任务,第一算子的输出张量为第二算子的一个输入张量;第一处理器确定存储分配规则;其中,存储分配规则包括:将第一算子的输出张量存储至第二处理器内部的存储介质的规则;第一处理器生成待执行任务的第二代码,第二代码为能够在第二处理器上的张量计算加速硬件并行执行的代码,第二代码描述了存储分配规则;第一处理器向第二处理器发送第二代码。
-
公开(公告)号:CN112559163B
公开(公告)日:2023-05-23
申请号:CN201910854534.3
申请日:2019-09-10
Applicant: 华为技术有限公司 , 中国科学院计算技术研究所
Abstract: 本申请公开优化张量计算性能的方法及装置,涉及深度学习技术领域,有助于加快待执行任务的执行速度,从而有助于提升张量计算的整体性能。该方法包括:第一处理器接收待执行任务的第一代码,待执行任务是对至少一个输入张量进行第一算子和第二算子的运算的任务,第一算子的输出张量为第二算子的一个输入张量;第一处理器确定存储分配规则;其中,存储分配规则包括:将第一算子的输出张量存储至第二处理器内部的存储介质的规则;第一处理器生成待执行任务的第二代码,第二代码为能够在第二处理器上的张量加速硬件并行执行的代码,第二代码描述了存储分配规则;第一处理器向第二处理器发送第二代码。
-
公开(公告)号:CN112559163A
公开(公告)日:2021-03-26
申请号:CN201910854534.3
申请日:2019-09-10
Applicant: 华为技术有限公司 , 中国科学院计算技术研究所
Abstract: 本申请公开优化张量计算性能的方法及装置,涉及深度学习技术领域,有助于加快待执行任务的执行速度,从而有助于提升张量计算的整体性能。该方法包括:第一处理器接收待执行任务的第一代码,待执行任务是对至少一个输入张量进行第一算子和第二算子的运算的任务,第一算子的输出张量为第二算子的一个输入张量;第一处理器确定存储分配规则;其中,存储分配规则包括:将第一算子的输出张量存储至第二处理器内部的存储介质的规则;第一处理器生成待执行任务的第二代码,第二代码为能够在第二处理器上的张量加速硬件并行执行的代码,第二代码描述了存储分配规则;第一处理器向第二处理器发送第二代码。
-
公开(公告)号:CN119718852A
公开(公告)日:2025-03-28
申请号:CN202311287925.4
申请日:2023-09-28
Applicant: 成都华为技术有限公司
IPC: G06F11/34 , G06F18/214 , G06F11/30
Abstract: 一种存储性能预测方法及装置,该方法中,获取用户在配置界面输入或选择的业务需求,该业务需求包括待部署的业务的特征参数以及将用于部署所述业务的目标设备的规格参数;将获取的业务需求所包括的业务的特征参数和目标设备所使用的计算资源数目作为性能预测模型的输入数据,以得到性能预测模型输出的预测结果,预测结果用于指示所述目标设备运行该业务的存储性能;其中,性能预测模型用于预测目标设备基于不同数目的计算资源运行该业务的存储性能。
-
公开(公告)号:CN119497847A
公开(公告)日:2025-02-21
申请号:CN202280097695.2
申请日:2022-06-30
Applicant: 华为技术有限公司
IPC: G06F9/50
Abstract: 一种张量计算的分块策略生成方法,获取张量计算对应的多个张量操作的信息,每个张量操作的信息包括张量操作对应的张量计算维度、张量计算维度对应元素的数据类型和张量计算维度的优先级(S301);确定多个张量操作与多个硬件单元的对应关系,多个硬件单元用于对张量计算进行运算(S302);基于张量操作对应的硬件单元的特性信息、张量操作对应的存储空间、张量计算维度对应元素的数据类型和张量计算维度的优先级,得到张量操作对应的张量计算维度的分块策略(S303);基于多个张量操作对应的张量计算维度的分块策略,得到张量计算的分块策略(S304)。通过该方法生成性能优秀的分块策略代码,提升了张量计算的整体性能。
-
公开(公告)号:CN113994350A
公开(公告)日:2022-01-28
申请号:CN202080038111.5
申请日:2020-03-27
Applicant: 华为技术有限公司
Abstract: 各种实施例涉及确定神经网络的并行计算方案。一种设备可以接收计算图并将所述计算图变换为包括递归子图的数据流图。每个递归子图可以包括另一递归子图和算子节点的元组或者空图。所述设备可以基于并行计算设备的数量确定切分递归的次数。对于每次切分递归,所述设备可以确定算子节点对应的成本;确定所述递归子图的处理顺序;以及处理所述递归子图。为了处理递归子图,所述设备可以为与所述递归子图的算子节点相关联的一个或多个张量选择切分轴。所述设备可以输出切分方案,其中,所述切分方案包括与所述算子节点相关联的每个张量的切分轴。本申请公开了多种设备、方法和计算机程序。
-
公开(公告)号:CN111291240A
公开(公告)日:2020-06-16
申请号:CN201811489176.2
申请日:2018-12-06
Applicant: 华为技术有限公司
IPC: G06F16/9032
Abstract: 本申请提供一种处理数据的方法和数据处理装置,该方法包括:数据处理装置获取对应于输入数据的输入张量;该数据处理装置确定M1个第一类张量块和M2个第二类张量块;该数据处理装置中的P个处理单元并行处理该M个张量块,其中在第一时间段内,该P个运算单元并行处理的张量块均为第一类张量块;在第二时间段内,该P个运算单元并行处理的张量块均为第二类张量块。上述技术方案中,数据处理装置根据张量块的属性,从M个张量块内确定出了属性相同的张量块,数据处理装置内的处理单元可以根据张量块的属性,对属性相同的张量块进行并行处理,这样,可以提高该数据处理装置处理数据的速度。
-
公开(公告)号:CN117785441A
公开(公告)日:2024-03-29
申请号:CN202311614611.0
申请日:2018-12-06
Applicant: 华为技术有限公司
Abstract: 本申请提供一种处理数据的方法和数据处理装置,该方法包括:数据处理装置获取对应于输入数据的输入张量;该数据处理装置确定M1个第一类张量块和M2个第二类张量块;该数据处理装置中的P个处理单元并行处理该M个张量块,其中在第一时间段内,该P个运算单元并行处理的张量块均为第一类张量块;在第二时间段内,该P个运算单元并行处理的张量块均为第二类张量块。上述技术方案中,数据处理装置根据张量块的属性,从M个张量块内确定出了属性相同的张量块,数据处理装置内的处理单元可以根据张量块的属性,对属性相同的张量块进行并行处理,这样,可以提高该数据处理装置处理数据的速度。
-
公开(公告)号:CN111291240B
公开(公告)日:2023-12-08
申请号:CN201811489176.2
申请日:2018-12-06
Applicant: 华为技术有限公司
IPC: G06F16/9032
Abstract: 本申请提供一种处理数据的方法和数据处理装置,该方法包括:数据处理装置获取对应于输入数据的输入张量;该数据处理装置确定M1个第一类张量块和M2个第二类张量块;该数据处理装置中的P个处理单元并行处理该M个张量块,其中在第一时间段内,该P个运算单元并行处理的张量块均为第一类张量块;在第二时间段内,该P个运算单元并行处理的张量块均为第二类张量块。上述技术方案中,数据处理装置根据张量块的属性,从M个张量块内确定出了属性相同的张量块,数据处理装置内的处理单元可以根据张量块的属性,对属性相同的张量块进行并行处理,这样,可以提高该数据处理装置处理数据的速
-
公开(公告)号:CN114816973A
公开(公告)日:2022-07-29
申请号:CN202110119863.0
申请日:2021-01-28
Applicant: 华为技术有限公司
IPC: G06F11/36
Abstract: 本申请涉及软件开发技术领域,提供了一种调试代码的方法、装置、电子设备和可读存储介质,电子设备可以是手机、平板电脑、可穿戴设备、车载设备等,该方法包括:获取目标调试命令,目标调试命令用于调试第一代码;根据目标调试命令确定执行第一代码的语言场景;若语言场景为跨语言场景,则从调试服务中调用第一语言调试核心调试第一代码,其中,调试服务还包括第一语言调试核心,第二语言调试核心用于调试第二代码,第二代码为调试第一代码前最后调试的代码;若语言场景为非跨语言场景,则从调试服务中调用第二语言调试核心调试第一代码。以上方法能够减少代码调试占用的资源。
-
-
-
-
-
-
-
-
-