-
公开(公告)号:CN115729617A
公开(公告)日:2023-03-03
申请号:CN202210906473.2
申请日:2022-07-29
Applicant: 英特尔公司
Abstract: 本申请公开了BFLOAT16融合乘法指令。描述了用于响应于指令而执行BF16FMA的技术。在一些示例中,指令包括用于以下各项的字段:操作码、紧缩数据源/目的地操作对象(第一源)的位置的标识、第二紧缩数据源操作对象的位置的标识、第三紧缩数据源操作对象的位置的标识、以及紧缩数据源/目的地操作对象的位置的标识,其中,操作码用于指示出操作对象排序并且指示出执行电路要进行:针对每一数据元素位置使用第一、第二和第三源操作对象执行BF16值融合乘法‑累加操作,以及将结果存储在源/目的地操作对象的对应数据元素位置中。
-
-
公开(公告)号:CN119226682A
公开(公告)日:2024-12-31
申请号:CN202311827814.8
申请日:2023-12-27
Applicant: 英特尔公司
IPC: G06F17/16
Abstract: 公开了向量紧缩矩阵乘法和累加处理器、方法、系统和指令。解码器电路对指令解码,该指令指示:第一向量寄存器,具有存储具有2行乘K列数据元素的第一矩阵的128比特通道,数据元素具有一比特数;存储位置,具有存储具有K行乘2列数据元素的第二矩阵的128比特,这些数据元素具有该比特数;以及第二向量寄存器,具有存储具有2行乘2列数据元素的第三矩阵的128比特通道,这些数据元素具有一更大的比特数。执行电路执行指令的操作,包括生成结果矩阵并将其存储在第二向量寄存器的128比特通道中,结果矩阵具有2行乘2列结果数据元素,结果数据元素具有该更大的比特数。结果矩阵表示第三矩阵与从使用第一和第二矩阵的矩阵乘法生成的乘积矩阵的累加。
-
公开(公告)号:CN115729620A
公开(公告)日:2023-03-03
申请号:CN202210908969.3
申请日:2022-07-29
Applicant: 英特尔公司
Abstract: 本申请公开了BFLOAT16平方根和/或平方根倒数指令。描述了用于响应于指令而对BF16数据元素执行平方根或平方根倒数计算的技术。指令的示例是这样的指令:该指令具有用于以下各项的字段:操作码、紧缩数据源操作对象的位置的标识、以及紧缩数据目的地操作对象的标识,其中,操作码用于指示出执行电路要进行:针对紧缩数据源操作对象的每个数据元素位置执行该位置中的BF16数据元素的平方根值的计算,以及将每个平方根的结果存储到紧缩数据目的地操作对象的对应数据元素位置中。
-
-
公开(公告)号:CN115729618A
公开(公告)日:2023-03-03
申请号:CN202210906476.6
申请日:2022-07-29
Applicant: 英特尔公司
Abstract: 本申请公开了BFLOAT16算术指令。描述了用于对BF16值执行算术操作的技术。示例性指令包括用于以下各项的字段:操作码、第一紧缩数据源操作对象的位置的标识、第二紧缩数据源操作对象的位置的标识、以及紧缩数据目的地操作对象的位置的标识,其中,操作码用于指示出算术操作执行电路要进行:针对所标识的紧缩数据源操作对象的每个数据元素位置、按BF16格式对该数据元素位置中的BF16数据元素执行算术操作,以及将每个算术操作的结果存储到所标识的紧缩数据目的地操作对象的对应数据元素位置中。
-
公开(公告)号:CN115904492A
公开(公告)日:2023-04-04
申请号:CN202210906480.2
申请日:2022-07-29
Applicant: 英特尔公司
Abstract: 本申请公开了BFLOAT16分类和操纵指令。描述了用于使用单个指令进行BF16分类或操纵的技术。示例性指令包括用于以下各项的字段:操作码、紧缩数据源操作对象的位置的标识、要执行的一个或多个分类检查的指示、以及紧缩数据目的地操作对象的标识,其中,操作码用于指示出执行电路要进行:针对紧缩数据源操作对象的每个数据元素位置、根据所指示的一个或多个分类检查来执行分类,以及将分类的结果存储在目的地操作对象的对应数据元素位置中。
-
-
-
-
-
-