经改进的插入指令的装置和方法

    公开(公告)号:CN107193537A

    公开(公告)日:2017-09-22

    申请号:CN201710399789.6

    申请日:2011-12-23

    Abstract: 本申请公开了经改进的插入指令的装置和方法。描述了一种装置,该装置具有指令执行逻辑电路,该指令执行逻辑电路用于执行第一、第二、第三和第四指令。第一指令和第二指令二者将第一组输入向量元素插入相应的第一和第二结果向量的多个第一不重叠部分中的一个部分中。第一组具有第一位宽。多个第一不重叠部分中的每个部分具有与第一组相同的位宽。第三指令和第四指令二者将第二组输入向量元素插入相应的第三和第四结果向量的多个第二不重叠部分中的一个部分中。第二组具有比所述第一位宽大的第二位宽。多个第二不重叠部分中的每个部分具有与第二组相同的位宽。该装置还包括掩码层电路,该掩码层电路用于在第一结果向量粒度下对第一和第三指令进行掩码操作,并在第二结果向量粒度下对第二和第四指令进行掩码操作。

    用于16比特浮点矩阵点积指令的装置、方法和系统

    公开(公告)号:CN116097212A

    公开(公告)日:2023-05-09

    申请号:CN202180052812.9

    申请日:2021-08-26

    Abstract: 描述涉及16比特浮点矩阵点积指令的系统、方法和装置。在一个实施例中,处理器包括:取得电路,取得单个指令,具有指定操作码以及具有单精度元素的M×N的目的地矩阵、M×K的第一源矩阵和K×N的第二源矩阵的位置的字段,源矩阵具有各自包括一对半精度浮点值的元素,操作码指示执行电路:对于第一源矩阵的每个元素和第二源矩阵的对应元素,使半精度浮点值转换为单精度值,使来自对中的第一值的经转换的单精度值一起相乘生成第一结果,使来自对中的第二值的经转换的单精度值一起相乘生成第二结果,以及使第一结果和第二结果与目的地矩阵的对应元素的先前内容累加;解码电路,对取得的指令解码;以及执行电路,如操作码指定地响应经解码的指令。

    线程暂停处理器、方法、系统及指令

    公开(公告)号:CN105279016B

    公开(公告)日:2019-06-28

    申请号:CN201510350735.1

    申请日:2015-06-23

    Abstract: 本申请公开了线程暂停处理器、方法、系统及指令。一个方面的处理器包括解码单元,用于对来自第一线程的线程暂停指令进行解码。该处理器的后端部与该解码单元耦合。该处理器的后端部用于:响应于该线程暂停指令,暂停对用于执行的第一线程的后续指令的处理。这些后续的指令按程序顺序在该线程暂停指令之后发生。该后端部还用于:响应于该线程暂停指令,保持处理器的后端部的至少多数排空该第一线程中除线程暂停指令之外的指令长达预定的时间段。上述多数可包括多个执行单元和指令队列单元。

Patent Agency Ranking