-
公开(公告)号:CN115729617A
公开(公告)日:2023-03-03
申请号:CN202210906473.2
申请日:2022-07-29
Applicant: 英特尔公司
Abstract: 本申请公开了BFLOAT16融合乘法指令。描述了用于响应于指令而执行BF16FMA的技术。在一些示例中,指令包括用于以下各项的字段:操作码、紧缩数据源/目的地操作对象(第一源)的位置的标识、第二紧缩数据源操作对象的位置的标识、第三紧缩数据源操作对象的位置的标识、以及紧缩数据源/目的地操作对象的位置的标识,其中,操作码用于指示出操作对象排序并且指示出执行电路要进行:针对每一数据元素位置使用第一、第二和第三源操作对象执行BF16值融合乘法‑累加操作,以及将结果存储在源/目的地操作对象的对应数据元素位置中。
-
公开(公告)号:CN115904492A
公开(公告)日:2023-04-04
申请号:CN202210906480.2
申请日:2022-07-29
Applicant: 英特尔公司
Abstract: 本申请公开了BFLOAT16分类和操纵指令。描述了用于使用单个指令进行BF16分类或操纵的技术。示例性指令包括用于以下各项的字段:操作码、紧缩数据源操作对象的位置的标识、要执行的一个或多个分类检查的指示、以及紧缩数据目的地操作对象的标识,其中,操作码用于指示出执行电路要进行:针对紧缩数据源操作对象的每个数据元素位置、根据所指示的一个或多个分类检查来执行分类,以及将分类的结果存储在目的地操作对象的对应数据元素位置中。
-
公开(公告)号:CN109947481A
公开(公告)日:2019-06-28
申请号:CN201811394086.5
申请日:2018-11-21
Applicant: 英特尔公司
Inventor: C·安德森 , E·乌尔德-阿迈德-瓦尔 , M·科尔内亚-哈瑟甘 , R·凡伦天 , M·查尼 , J·考博尔 , V·马杜里
IPC: G06F9/308
Abstract: 本申请提供了用于处理分数倒数操作的装置和方法。一种用于执行倒数的装置和方法。例如,处理器的一个实施例包括:解码器,用于对倒数指令解码以生成经解码的倒数指令;源寄存器,用于存储至少一个紧缩输入数据元素;目的地寄存器,用于存储结果数据元素;以及倒数执行电路,用于执行经解码的倒数指令,该倒数执行电路用于将紧缩输入数据元素的第一部分用作对包含多组系数的数据结构的索引,以从多组系数标识第一组系数,该倒数执行电路用于使用系数和紧缩输入数据元素的第二部分的组合来生成紧缩输入数据元素的倒数。
-
-
公开(公告)号:CN115525337A
公开(公告)日:2022-12-27
申请号:CN202210730505.8
申请日:2022-06-24
Applicant: 英特尔公司
Abstract: 公开了用于向量紧缩有符号/无符号移位的装置和方法。装置包括解码器和执行电路。解码器用于对指令解码,该指令具有用于以下各项的字段:用于提供第一和第二源数据元素的第一紧缩数据源操作数、用于提供对应的第一和第二移位值的第二紧缩数据源操作数或立即数、以及用于指示对应的第一结果值和第二结果值的紧缩数据目的地操作数。执行电路用于执行经解码的指令以:分别基于第一和第二移位值将第一和第二源数据元素移位一定的量;响应于检测到饱和状况而更新饱和指示符;对第一和第二经移位的数据元素进行舍入和/或饱和以生成第一和第二结果值;以及将该第一和第二结果值存储在目的地寄存器中的数据元素位置中。
-
公开(公告)号:CN115525252A
公开(公告)日:2022-12-27
申请号:CN202210730208.3
申请日:2022-06-24
Applicant: 英特尔公司
Abstract: 本申请公开了四字16×16乘法和累加的双求和。描述了用于矩阵乘法的技术。在一些示例中,使用单条指令,该单条指令具有以下格式:用于操作码的字段、用于指示源/目的地操作数的位置的一个或多个字段、用于指示第一源操作数的位置的一个或多个字段、以及用于指示第二源操作数的位置的一个或多个字段。其中,操作码指示执行电路用于将来自第一源操作数和第二源操作数的对应数据元素的值相乘,将所乘的值的第一子集与来自源/目的地操作数的第一值相加并存储在源/目的地操作数的第一数据元素位置中,并且将所乘的值的第二子集与来自源/目的地操作数的第二值相加并存储在源/目的地操作数的第二数据元素位置中。
-
-
公开(公告)号:CN115729618A
公开(公告)日:2023-03-03
申请号:CN202210906476.6
申请日:2022-07-29
Applicant: 英特尔公司
Abstract: 本申请公开了BFLOAT16算术指令。描述了用于对BF16值执行算术操作的技术。示例性指令包括用于以下各项的字段:操作码、第一紧缩数据源操作对象的位置的标识、第二紧缩数据源操作对象的位置的标识、以及紧缩数据目的地操作对象的位置的标识,其中,操作码用于指示出算术操作执行电路要进行:针对所标识的紧缩数据源操作对象的每个数据元素位置、按BF16格式对该数据元素位置中的BF16数据元素执行算术操作,以及将每个算术操作的结果存储到所标识的紧缩数据目的地操作对象的对应数据元素位置中。
-
公开(公告)号:CN115729620A
公开(公告)日:2023-03-03
申请号:CN202210908969.3
申请日:2022-07-29
Applicant: 英特尔公司
Abstract: 本申请公开了BFLOAT16平方根和/或平方根倒数指令。描述了用于响应于指令而对BF16数据元素执行平方根或平方根倒数计算的技术。指令的示例是这样的指令:该指令具有用于以下各项的字段:操作码、紧缩数据源操作对象的位置的标识、以及紧缩数据目的地操作对象的标识,其中,操作码用于指示出执行电路要进行:针对紧缩数据源操作对象的每个数据元素位置执行该位置中的BF16数据元素的平方根值的计算,以及将每个平方根的结果存储到紧缩数据目的地操作对象的对应数据元素位置中。
-
公开(公告)号:CN109947475A
公开(公告)日:2019-06-28
申请号:CN201811393877.6
申请日:2018-11-21
Applicant: 英特尔公司
Inventor: C·安德森 , E·乌尔德-阿迈德-瓦尔 , M·科尔内亚-哈瑟甘 , R·凡伦天 , M·查尼 , J·考博尔 , V·马杜里
IPC: G06F9/30
Abstract: 本申请公开了用于处理平方根倒数操作的装置和方法。用于执行平方根倒数的装置和方法。例如,处理器的一个实施例包括:解码器,用于对平方根倒数指令解码以生成经解码的平方根倒数指令;源寄存器,用于存储至少一个紧缩输入数据元素;目的地寄存器,用于存储结果数据元素;以及平方根倒数执行电路,用于执行经解码的平方根倒数指令,平方根倒数执行电路用于使用紧缩输入数据元素的第一部分作为包含多个系数集合的数据结构的索引以从多个集合中标识第一系数集合,平方根倒数执行电路用于:通过使用系数与紧缩输入数据元素的第二部分的组合来生成紧缩输入数据元素的平方根倒数。
-
-
-
-
-
-
-
-
-