BFLOAT16融合乘法指令

    公开(公告)号:CN115729617A

    公开(公告)日:2023-03-03

    申请号:CN202210906473.2

    申请日:2022-07-29

    Abstract: 本申请公开了BFLOAT16融合乘法指令。描述了用于响应于指令而执行BF16FMA的技术。在一些示例中,指令包括用于以下各项的字段:操作码、紧缩数据源/目的地操作对象(第一源)的位置的标识、第二紧缩数据源操作对象的位置的标识、第三紧缩数据源操作对象的位置的标识、以及紧缩数据源/目的地操作对象的位置的标识,其中,操作码用于指示出操作对象排序并且指示出执行电路要进行:针对每一数据元素位置使用第一、第二和第三源操作对象执行BF16值融合乘法‑累加操作,以及将结果存储在源/目的地操作对象的对应数据元素位置中。

    浮点加法器的交错流水线
    5.
    发明公开

    公开(公告)号:CN111752618A

    公开(公告)日:2020-10-09

    申请号:CN202010127345.9

    申请日:2020-02-28

    Abstract: 本申请公开了浮点加法器的交错流水线。所公开实施例涉及浮点(FP)加法器的交错流水线。在一个示例中,处理器用于执行指令,该指令指定操作码并指定M乘K的第一源矩阵、K乘N的第二源矩阵、和M乘N的目的地矩阵的位置,该操作码指示执行电路用于针对目的地矩阵的每个FP元素(M,N)启动流水线的K个实例,该流水线的K个实例具有:第一乘法级,在第一乘法级期间将第一源矩阵的FP元素(M,K)与第二源矩阵的对应FP元素(K,N)相乘;并发地,在指数差级中,确定乘积与目的地矩阵的元素(M,N)的前一FP值之间的指数差;以及在第二加法-旁路级中,将乘积与前一FP值累加并且并发地将累加和旁路到后续流水线实例。

    使用浮点乘法-累加结果的模糊-J位位置

    公开(公告)号:CN111752605A

    公开(公告)日:2020-10-09

    申请号:CN202010101911.9

    申请日:2020-02-19

    Abstract: 本申请公开了使用浮点乘法-累加结果的模糊-J位位置。所公开实施例涉及执行浮点(FP)算术。在一个示例中,处理器用于对指令解码,该指令指定第一浮点(FP)操作数、第二FP操作数和第三FP操作数的位置以及操作码,该操作码要求将第一FP操作数和第二FP操作数的FP乘积与第三FP操作数的先前内容累加,并且执行电路用于:在第一周期中,生成具有模糊-J位格式的FP乘积,该模糊-J位格式包括符号位、9位的指数、以及25位的尾数,该25位的尾数具有用于J位的两个可能位置;以及在第二周期中,将FP乘积与第三FP操作数累加,同时并发地基于FP乘积与第三FP操作数的J位位置来确定对累加的结果的指数调节和尾数移位控制,其中并发地执行指数调节提高在一个周期中执行累加的能力。

    经改进的提取指令的装置和方法

    公开(公告)号:CN104115114B

    公开(公告)日:2018-06-12

    申请号:CN201180076304.0

    申请日:2011-12-23

    Abstract: 描述了一种装置,该装置包含指令执行逻辑电路,该指令执行逻辑电路用于执行第一、第二、第三和第四指令。第一指令和第二指令二者从相应的第一和第二输入向量的多个第一不重叠部分中的一个部分中选择第一组输入向量元素。第一组具有第一位宽。多个第一不重叠部分中的每个部分具有与第一组相同的位宽。第三指令和第四指令两者从相应的第三和第四输入向量的多个第二不重叠部分中的一个部分中选择第二组输入向量元素。第二组具有比所述第一位宽大的第二位宽。多个第二不重叠部分中的每个部分具有与第二组相同的位宽。该装置包括掩码层电路,该掩码层电路用于在第一粒度下对第一和第三指令的第一和第二组进行掩码操作,其中利用该操作产生的相应结果是第一和第三指令的相应结果。该掩码层电路还用于在第二粒度下对第二和第四指令的第一和第二组进行掩码操作,其中利用该操作产生的相应结果是第二和第四指令的相应结果。

    用于条件存储器错误帮助抑制的方法、处理器和处理系统

    公开(公告)号:CN104915181B

    公开(公告)日:2018-06-05

    申请号:CN201510080157.4

    申请日:2015-02-13

    CPC classification number: G06F11/079 G06F11/0721 G06F11/073

    Abstract: 在一些公开的实施例中,指令执行逻辑提供条件存储器错误帮助抑制。处理器的一些实施例包括解码级,用于解码一个或多个指令,所述指令指定:存储器操作集合、一个或多个寄存器以及一个或多个存储器地址。一个或多个执行单元响应于一个或多个经解码的指令生成用于存储器操作集合的所述一个或多个存储器地址。指令执行逻辑记录一个或多个错误抑制位以指示是否对存储器操作集合的一个或多个部分进行掩码。当存储器操作集合中的错误的一个对应于存储器操作集合中被所述一个或多个错误抑制位指示为被掩码的部分时,抑制错误生成逻辑考虑对应于存储器操作集合中的所述错误的一个的存储器错误。

Patent Agency Ranking