BFLOAT16融合乘法指令

    公开(公告)号:CN115729617A

    公开(公告)日:2023-03-03

    申请号:CN202210906473.2

    申请日:2022-07-29

    Abstract: 本申请公开了BFLOAT16融合乘法指令。描述了用于响应于指令而执行BF16FMA的技术。在一些示例中,指令包括用于以下各项的字段:操作码、紧缩数据源/目的地操作对象(第一源)的位置的标识、第二紧缩数据源操作对象的位置的标识、第三紧缩数据源操作对象的位置的标识、以及紧缩数据源/目的地操作对象的位置的标识,其中,操作码用于指示出操作对象排序并且指示出执行电路要进行:针对每一数据元素位置使用第一、第二和第三源操作对象执行BF16值融合乘法‑累加操作,以及将结果存储在源/目的地操作对象的对应数据元素位置中。

    向量紧缩矩阵乘法和累加处理器、方法、系统和指令

    公开(公告)号:CN119226682A

    公开(公告)日:2024-12-31

    申请号:CN202311827814.8

    申请日:2023-12-27

    Abstract: 公开了向量紧缩矩阵乘法和累加处理器、方法、系统和指令。解码器电路对指令解码,该指令指示:第一向量寄存器,具有存储具有2行乘K列数据元素的第一矩阵的128比特通道,数据元素具有一比特数;存储位置,具有存储具有K行乘2列数据元素的第二矩阵的128比特,这些数据元素具有该比特数;以及第二向量寄存器,具有存储具有2行乘2列数据元素的第三矩阵的128比特通道,这些数据元素具有一更大的比特数。执行电路执行指令的操作,包括生成结果矩阵并将其存储在第二向量寄存器的128比特通道中,结果矩阵具有2行乘2列结果数据元素,结果数据元素具有该更大的比特数。结果矩阵表示第三矩阵与从使用第一和第二矩阵的矩阵乘法生成的乘积矩阵的累加。

    BFLOAT16算术指令
    6.
    发明公开

    公开(公告)号:CN115729618A

    公开(公告)日:2023-03-03

    申请号:CN202210906476.6

    申请日:2022-07-29

    Abstract: 本申请公开了BFLOAT16算术指令。描述了用于对BF16值执行算术操作的技术。示例性指令包括用于以下各项的字段:操作码、第一紧缩数据源操作对象的位置的标识、第二紧缩数据源操作对象的位置的标识、以及紧缩数据目的地操作对象的位置的标识,其中,操作码用于指示出算术操作执行电路要进行:针对所标识的紧缩数据源操作对象的每个数据元素位置、按BF16格式对该数据元素位置中的BF16数据元素执行算术操作,以及将每个算术操作的结果存储到所标识的紧缩数据目的地操作对象的对应数据元素位置中。

Patent Agency Ranking