BFLOAT16算术指令
    34.
    发明公开

    公开(公告)号:CN115729618A

    公开(公告)日:2023-03-03

    申请号:CN202210906476.6

    申请日:2022-07-29

    Abstract: 本申请公开了BFLOAT16算术指令。描述了用于对BF16值执行算术操作的技术。示例性指令包括用于以下各项的字段:操作码、第一紧缩数据源操作对象的位置的标识、第二紧缩数据源操作对象的位置的标识、以及紧缩数据目的地操作对象的位置的标识,其中,操作码用于指示出算术操作执行电路要进行:针对所标识的紧缩数据源操作对象的每个数据元素位置、按BF16格式对该数据元素位置中的BF16数据元素执行算术操作,以及将每个算术操作的结果存储到所标识的紧缩数据目的地操作对象的对应数据元素位置中。

    用于数据类型的下转换的装置和方法

    公开(公告)号:CN112416432A

    公开(公告)日:2021-02-26

    申请号:CN202011202842.7

    申请日:2011-12-23

    Abstract: 本申请公开了用于数据类型的下转换的装置和方法。描述了用于使用掩码从源操作数向目的地操作数下转换的装置和方法。例如,根据一个实施例的方法包括以下操作:读取要从第一值下转换成经下转换的值并存储在目的地位置的源操作数值;读取存储在掩码寄存器中的每个掩码寄存器位,掩码寄存器位指示是否对源操作数值执行掩码操作或转换操作;如果掩码寄存器位指示要执行掩码操作,则执行所指定的掩码操作并将掩码操作的结果存储在目的地位置;以及,如果掩码寄存器位指示不要执行掩码操作,则下转换源操作数值并将经下转换的值存储在所指定的目的地位置。

    使用索引阵列和有限状态机的分散

    公开(公告)号:CN104303142B

    公开(公告)日:2019-03-08

    申请号:CN201280072904.4

    申请日:2012-06-02

    Abstract: 公开了使用索引阵列和有限状态机进行分散/聚集操作的方法和装置。装置的实施例可包括:解码逻辑,用于解码分散/聚集指令并生成微操作。索引阵列保持一组索引和相应的一组掩码元素。有限状态机促成分散操作。地址生成逻辑至少针对具有第一值的每个相应掩码元素从该组索引中的索引生成地址。在缓冲器中为所生成的该组地址中的每个地址分配存储。将对应于所生成的该组地址的数据元素复制到缓冲器。如果相应的掩码元素具有所述第一值,则访问该组中的地址以存储数据元素,并且响应于其相应存储的完成,掩码元素被改变为第二值。

Patent Agency Ranking