-
公开(公告)号:CN116594589B
公开(公告)日:2024-03-26
申请号:CN202310511127.9
申请日:2019-12-31
Applicant: 华为技术有限公司
Abstract: 本申请实施例公开了一种浮点数乘法计算的方法、装置和算术逻辑单元,属于数据处理领域。所述方法包括:获取多个待计算的第一精度浮点数;对每个待计算的第一精度浮点数进行分解,得到至少两个第二精度浮点数,其中,所述第二精度浮点数的精度低于所述第一精度浮点数的精度;确定各种由分解自不同的第一精度浮点数的两个第二精度浮点数组成的组合;将每种组合中的第二精度浮点数输入第二精度乘法器中,得到每种组合对应的中间计算结果;基于每种组合对应的中间计算结果,确定所述多个待计算的第一精度浮点数的计算结果。采用本申请,可以节省计算资源。
-
公开(公告)号:CN117217296A
公开(公告)日:2023-12-12
申请号:CN202211289095.4
申请日:2022-10-20
Applicant: 华为技术有限公司
Abstract: 本申请提供一种数据处理方法、装置及相关设备,该方法包括:计算设备根据待压缩的多个第一数据确定第一基准值;然后计算每个第一数据与第一基准值的差值;确定每个差值对应的编码;根据每个编码得到对应的第一数据被压缩后的数据。其中,各个第一数据对应的编码中的部分或全部编码的长度小于原第一数据的长度。上述基准值是待压缩的多个数据中出现次数较多的数据,待压缩的多个数据分别与基准值做差值时,得到的多个差值中0的数量最多,将差值进行编码后,能够将差值对应的数据压缩到较少的位数;由于编码所占的比特位小于各个数据,从而能够实现对数据的压缩,降低不同计算设备之间交互的数据量,提高数据传输效率。
-
公开(公告)号:CN108733678A
公开(公告)日:2018-11-02
申请号:CN201710245610.1
申请日:2017-04-14
Applicant: 华为技术有限公司
Inventor: 沈胜宇
Abstract: 本申请公开一种数据搜索的方法,该方法包括:第一处理器接收搜索请求消息,搜索请求消息中包括搜索条件和待搜索树的根节点的地址;根据搜索请求消息确定待搜索树的根节点的地址所在第一内存和管理第一内存的处理器关联的第一内存控制器;根据搜索请求消息和预置的搜索算法确定搜索指令;将搜索指令发送给第一内存控制器;接收第一内存控制器发送的第一数据,第一数据为第一内存中满足搜索条件的数据;接收第二内存控制器发送的第二数据,第二内存控制器为管理第二内存的处理器关联的内存控制器,第二内存为存储待搜索树的子树所在的内存,第二数据为第二内存中满足搜索条件的数据;根据第一数据和第二数据生成搜索结果。
-
公开(公告)号:CN113076280B
公开(公告)日:2024-03-01
申请号:CN201911312976.1
申请日:2019-12-18
Applicant: 华为技术有限公司
IPC: G06F15/173
Abstract: 本申请实施例提供一种数据传输方法及相关设备,其中方法包括:接收端接收发送端发送的待传输数据的数据信息,该数据信息包括发送端待传输数据的大小;根据所述待传输数据的大小,生成多个RDMA读请求;接收端发送多个RDMA读请求至所述发送端,并使所发送的多个RDMA读请求所读取的数据所占用的带宽小于等于所述接收端的入口带宽。通过实施上述方法,接收端在生成多个RDMA读请求之后,将这多个RDMA读请求分多次发送至发送端,以控制接收端在两次发送RDMA读请求的时间间隔内接收到的应答消息对应的数据量,从而防止接收端的入口出现拥塞,降低数据传输时延。
-
公开(公告)号:CN116049084A
公开(公告)日:2023-05-02
申请号:CN202111617115.1
申请日:2021-12-27
Applicant: 华为技术有限公司
IPC: G06F15/173 , G06F30/39 , G06N3/0464 , G06F115/04
Abstract: 本申请提供一种模型训练系统和方法,用于在大量处理器之间实现数据的高效传递。其中系统中包括:第一群组,第一群组中包括MEMS和S×C个处理器,其中,S为第一群组中的节点个数,C为一个节点中处理器的个数,S、C均为正整数;MEMS,用于在S个节点中的任两个节点之间构建光传输通道;S×C个处理器,用于联合训练模型。在联合训练模型的一次迭代中,S×C个处理器用于运行各自处理器中的模型训练,以得到各自对应的数据,S×C个处理器中的至少两个处理器通过光传输通道传输目标数据,其中接收目标数据的处理器可用于根据该目标数据调整该处理器中的模型训练的参数。
-
公开(公告)号:CN108733678B
公开(公告)日:2021-11-09
申请号:CN201710245610.1
申请日:2017-04-14
Applicant: 华为技术有限公司
Inventor: 沈胜宇
IPC: G06F16/22 , G06F16/2453 , G06F16/2455 , G06F16/245 , G06F9/50
Abstract: 本申请公开一种数据搜索的方法,该方法包括:第一处理器接收搜索请求消息,搜索请求消息中包括搜索条件和待搜索树的根节点的地址;根据搜索请求消息确定待搜索树的根节点的地址所在第一内存和管理第一内存的处理器关联的第一内存控制器;根据搜索请求消息和预置的搜索算法确定搜索指令;将搜索指令发送给第一内存控制器;接收第一内存控制器发送的第一数据,第一数据为第一内存中满足搜索条件的数据;接收第二内存控制器发送的第二数据,第二内存控制器为管理第二内存的处理器关联的内存控制器,第二内存为存储待搜索树的子树所在的内存,第二数据为第二内存中满足搜索条件的数据;根据第一数据和第二数据生成搜索结果。
-
公开(公告)号:CN108990422A
公开(公告)日:2018-12-11
申请号:CN201780000600.X
申请日:2017-03-31
Applicant: 华为技术有限公司
Inventor: 沈胜宇
Abstract: 一种锁分配的方法、装置及计算设备,该方法包括:第一节点控制器(NC)接收第二NC生成的第一迁移队列;第一迁移队列中队列头的加锁请求为第一加锁请求,第一加锁请求中包括第一NC的标识;将第一目标锁分配给第一NC关联的第一中央处理器(CPU);当接收到第一CPU发送的释放第一目标锁的请求时,删除第一迁移队列中队列头的第一加锁请求;当第一迁移队列不为空时,修改第二加锁请求的拿锁标志位为已拿锁状态,已拿锁状态用于标识第一目标锁被占用;第二加锁请求为删除了第一加锁请求的第一迁移队列中队列头的加锁请求;确定发出第二加锁请求的第三NC,以及将第一迁移队列发送给所述第三NC。以此解决锁竞争的问题。
-
公开(公告)号:CN117687597A
公开(公告)日:2024-03-12
申请号:CN202211060871.3
申请日:2022-08-31
Applicant: 华为技术有限公司
Abstract: 一种控制装置及方法,用于降低矩阵乘计算单元的功耗。在本申请中,控制方法由控制装置执行,控制装置中包括计算单元,计算单元中包括N个乘累加单元,方法包括:获取控制信息和计算信息,计算信息指示N个内积运算,N个内积运算与N个乘累加单元一一对应;根据控制信息,生成N个乘累加单元对应的控制信号,将控制信号输入计算单元中;控制信号用于控制M个内积运算对应的M个乘累加单元处于关闭状态、且N个乘累加单元中除M个乘累加单元之外的其他乘累加单元处于开启状态;获得计算单元根据控制信号和计算信息输出的、N个内积运算中除M个内积运算以外的其他内积运算的结果;其中,M和N均为大于1的整数。
-
公开(公告)号:CN116594589A
公开(公告)日:2023-08-15
申请号:CN202310511127.9
申请日:2019-12-31
Applicant: 华为技术有限公司
Abstract: 本申请实施例公开了一种浮点数乘法计算的方法、装置和算术逻辑单元,属于数据处理领域。所述方法包括:获取多个待计算的第一精度浮点数;对每个待计算的第一精度浮点数进行分解,得到至少两个第二精度浮点数,其中,所述第二精度浮点数的精度低于所述第一精度浮点数的精度;确定各种由分解自不同的第一精度浮点数的两个第二精度浮点数组成的组合;将每种组合中的第二精度浮点数输入第二精度乘法器中,得到每种组合对应的中间计算结果;基于每种组合对应的中间计算结果,确定所述多个待计算的第一精度浮点数的计算结果。采用本申请,可以节省计算资源。
-
-
-
-
-
-
-
-