-
公开(公告)号:CN117407644A
公开(公告)日:2024-01-16
申请号:CN202311493794.5
申请日:2017-07-01
Applicant: 英特尔公司
Inventor: R·凡伦天 , Z·斯波伯 , M·J·查尼 , B·L·托尔 , R·拉波波特 , S·什沃茨曼 , D·鲍姆 , I·亚诺弗 , E·乌尔德-阿迈德-瓦尔 , M·阿德尔曼 , J·考博尔 , Y·戈比尔 , S·卢巴诺维奇
Abstract: 本申请公开了用于片矩阵乘法和累加的系统、方法和装置。具体而言,讨论了矩阵(片)乘法累加和负版本矩阵(片)乘法累加。例如,在一些实施例中,详述了:解码电路,用于对指令解码,该指令具有用于操作码、第一源矩阵操作数的标识符、第二源矩阵操作数的标识符、以及源/目的地矩阵操作数的标识符的字段;以及执行电路,用于执行经解码的指令以:将所标识的第一源矩阵操作数乘以所标识的第二源矩阵操作数;将乘法的结果加到所标识的源/目的地矩阵操作数;以及将加法的结果存储在所标识的源/目的地矩阵操作数中并将所标识的源/目的地矩阵操作数的未配置列归零。
-
公开(公告)号:CN110337635B
公开(公告)日:2023-09-19
申请号:CN201780086894.2
申请日:2017-07-01
Applicant: 英特尔公司
Inventor: R·凡伦天 , D·鲍姆 , Z·斯波伯 , J·考博尔 , E·乌尔德-阿迈德-瓦尔 , B·L·托尔 , M·J·查尼 , M·阿德尔曼 , B·泽维 , A·海内克 , S·卢巴诺维奇
IPC: G06F9/30
Abstract: 本文中详述的实施例涉及矩阵操作。例如,详述了对矩阵(片)点积操作的指令支持的实施例。示例性指令包括:计算有符号字的点积,并利用饱和累加在双字中;计算字节的点积,并利用饱和累加到双字中,其中,输入字节可以是有符号或无符号的,并且双字累加具有输出饱和;等等。
-
-
公开(公告)号:CN115729618A
公开(公告)日:2023-03-03
申请号:CN202210906476.6
申请日:2022-07-29
Applicant: 英特尔公司
Abstract: 本申请公开了BFLOAT16算术指令。描述了用于对BF16值执行算术操作的技术。示例性指令包括用于以下各项的字段:操作码、第一紧缩数据源操作对象的位置的标识、第二紧缩数据源操作对象的位置的标识、以及紧缩数据目的地操作对象的位置的标识,其中,操作码用于指示出算术操作执行电路要进行:针对所标识的紧缩数据源操作对象的每个数据元素位置、按BF16格式对该数据元素位置中的BF16数据元素执行算术操作,以及将每个算术操作的结果存储到所标识的紧缩数据目的地操作对象的对应数据元素位置中。
-
公开(公告)号:CN112416432A
公开(公告)日:2021-02-26
申请号:CN202011202842.7
申请日:2011-12-23
Applicant: 英特尔公司
IPC: G06F9/30
Abstract: 本申请公开了用于数据类型的下转换的装置和方法。描述了用于使用掩码从源操作数向目的地操作数下转换的装置和方法。例如,根据一个实施例的方法包括以下操作:读取要从第一值下转换成经下转换的值并存储在目的地位置的源操作数值;读取存储在掩码寄存器中的每个掩码寄存器位,掩码寄存器位指示是否对源操作数值执行掩码操作或转换操作;如果掩码寄存器位指示要执行掩码操作,则执行所指定的掩码操作并将掩码操作的结果存储在目的地位置;以及,如果掩码寄存器位指示不要执行掩码操作,则下转换源操作数值并将经下转换的值存储在所指定的目的地位置。
-
公开(公告)号:CN111177648A
公开(公告)日:2020-05-19
申请号:CN201910954609.5
申请日:2019-10-09
Applicant: 英特尔公司
IPC: G06F17/16
Abstract: 所公开实施例涉及用于执行16位浮点向量点积指令的系统和方法。在一个示例中,处理器包括:取出电路,用于取出指令,该指令具有用于指定操作码以及第一源向量、第二源向量和目的地向量的位置的字段,该操作码用于指示执行电路用于将所指定的第一源和第二源的N对16位浮点格式化元素相乘,并且将所得的乘积与所指定的目的地的对应的单精度元素的先前内容累加;解码电路,用于对所取出的指令解码;以及执行电路,用于如该操作码所指定地对经解码的指令作出响应。
-
公开(公告)号:CN110312992A
公开(公告)日:2019-10-08
申请号:CN201780086978.6
申请日:2017-07-01
Applicant: 英特尔公司
Inventor: R·凡伦天 , Z·斯波伯 , M·J·查尼 , B·L·托尔 , R·拉波波特 , S·什沃茨曼 , D·鲍姆 , I·亚诺弗 , E·乌尔德-阿迈德-瓦尔 , M·阿德尔曼 , J·考博尔 , Y·戈比尔 , S·卢巴诺维奇
IPC: G06F9/30
Abstract: 本文中详述的实施例涉及矩阵操作。具体而言,讨论了矩阵(片)乘法累加和负版本矩阵(片)乘法累加。例如,在一些实施例中,详述了:解码电路,用于对指令解码,该指令具有用于操作码、第一源矩阵操作数的标识符、第二源矩阵操作数的标识符、以及源/目的地矩阵操作数的标识符的字段;以及执行电路,用于执行经解码的指令以:将所标识的第一源矩阵操作数乘以所标识的第二源矩阵操作数;将乘法的结果加到所标识的源/目的地矩阵操作数;以及将加法的结果存储在所标识的源/目的地矩阵操作数中并将所标识的源/目的地矩阵操作数的未配置列归零。
-
公开(公告)号:CN104303142B
公开(公告)日:2019-03-08
申请号:CN201280072904.4
申请日:2012-06-02
Applicant: 英特尔公司
Abstract: 公开了使用索引阵列和有限状态机进行分散/聚集操作的方法和装置。装置的实施例可包括:解码逻辑,用于解码分散/聚集指令并生成微操作。索引阵列保持一组索引和相应的一组掩码元素。有限状态机促成分散操作。地址生成逻辑至少针对具有第一值的每个相应掩码元素从该组索引中的索引生成地址。在缓冲器中为所生成的该组地址中的每个地址分配存储。将对应于所生成的该组地址的数据元素复制到缓冲器。如果相应的掩码元素具有所述第一值,则访问该组中的地址以存储数据元素,并且响应于其相应存储的完成,掩码元素被改变为第二值。
-
-
公开(公告)号:CN108519921A
公开(公告)日:2018-09-11
申请号:CN201810312051.6
申请日:2011-12-23
Applicant: 英特尔公司
IPC: G06F9/54
Abstract: 描述了用于从通用源寄存器向向量寄存器进行广播的装置和方法。例如,根据一个实施例的处理器包括:解码电路,用于解码指令,所述指令具有用于标识源操作数的第一字段以及用于标识目的地操作数的第二字段;执行电路,耦合到所述解码电路,其中所述执行电路用于执行经解码的指令以:标识所标识源操作数内要存储在所标识目的地操作数中的数据元素位置;将存储在所标识的数据元素位置中的数据广播到所标识目的地操作数的至少一个数据元素位置。
-
-
-
-
-
-
-
-
-