用于稀疏-密集矩阵乘法的加速器
    1.
    发明公开

    公开(公告)号:CN119377541A

    公开(公告)日:2025-01-28

    申请号:CN202411416040.4

    申请日:2019-03-25

    Abstract: 所公开的实施例涉及用于稀疏‑密集矩阵指令的加速器。在一个示例中,一种用于执行稀疏‑密集矩阵乘法指令的处理器,包括:取出电路,用于取出稀疏‑密集矩阵乘法指令,稀疏‑密集矩阵乘法指令具有用于指定操作码、密集输出矩阵、密集源矩阵、和具有非零元素的稀疏度的稀疏源矩阵的字段,稀疏度小于一;解码电路,用于对所取出的稀疏‑密集矩阵乘法指令解码;执行电路,用于执行经解码的稀疏‑密集矩阵乘法指令以对于所指定的稀疏源矩阵的行M和列K处的每个非零元素进行以下操作:生成该非零元素与所指定的密集源矩阵的行K和列N处的每个对应密集元素的乘积;以及生成每个所生成的乘积与所指定的密集输出矩阵的行M和列N处的对应输出元素的先前值的累加和。

    用于稀疏-密集矩阵乘法的加速器
    9.
    发明公开

    公开(公告)号:CN110321525A

    公开(公告)日:2019-10-11

    申请号:CN201910227563.7

    申请日:2019-03-25

    Abstract: 所公开的实施例涉及用于稀疏-密集矩阵指令的加速器。在一个示例中,一种用于执行稀疏-密集矩阵乘法指令的处理器,包括:取出电路,用于取出稀疏-密集矩阵乘法指令,稀疏-密集矩阵乘法指令具有用于指定操作码、密集输出矩阵、密集源矩阵、和具有非零元素的稀疏度的稀疏源矩阵的字段,稀疏度小于一;解码电路,用于对所取出的稀疏-密集矩阵乘法指令解码;执行电路,用于执行经解码的稀疏-密集矩阵乘法指令以对于所指定的稀疏源矩阵的行M和列K处的每个非零元素进行以下操作:生成该非零元素与所指定的密集源矩阵的行K和列N处的每个对应密集元素的乘积;以及生成每个所生成的乘积与所指定的密集输出矩阵的行M和列N处的对应输出元素的先前值的累加和。

Patent Agency Ranking