具有网格融合的混合精度神经网络加速器区块

    公开(公告)号:CN115496192A

    公开(公告)日:2022-12-20

    申请号:CN202210653239.3

    申请日:2022-06-09

    Abstract: 公开了一种神经网络加速器,包括乘法单元、加法器树单元和累加器单元。乘法单元和加法器树单元被配置为执行网格乘法操作。累加器单元耦接到加法器树的输出,以从由乘法单元和加法器树单元执行的网格乘法运算形成点积值。乘法单元包括执行基于网格乘法的运算并输出乘积值的n个乘法器单元。每个乘法器单元包括多个乘法器。每个乘法器单元接收第一和第二被乘数,每个被乘数包括最高有效半字节(MSN)和最低有效半字节(LSN)。每个乘法器单元中的乘法器接收被乘数的MSN和LSN的不同组合。乘法单元和加法器可以提供混合精度点积计算。

    用于执行卷积运算的方法和系统
    2.
    发明公开

    公开(公告)号:CN112989267A

    公开(公告)日:2021-06-18

    申请号:CN202011169398.3

    申请日:2020-10-28

    Abstract: 本公开涉及用于执行卷积运算的方法和系统。用于执行卷积运算的方法包括:将卷积核存储在第一存储设备中,该卷积核具有维度x乘y;将具有维度n乘m的输入特征图的元素值的第一子集存储在第二存储设备中;执行输入特征图的元素值的第一子集中的每个值与来自卷积核的x*y个元素当中的第一元素值的第一并列乘法;对于卷积核的x*y个元素中的每个剩余值,执行剩余值与输入特征图的元素值的对应子集的并列乘法;对于每个并列乘法,将并列乘法的结果存储在累加器中;以及输出累加器的值作为输出特征图的第一行。

    用于处置具有异常的处理的电路
    3.
    发明公开

    公开(公告)号:CN115599342A

    公开(公告)日:2023-01-13

    申请号:CN202210750069.0

    申请日:2022-06-28

    Abstract: 一种用于处置具有异常的处理的系统和方法。在一些实施例中,该方法包括:读取第一激活和第二激活,每个激活包括最低有效部分和最高有效部分;将第一权重和第二权重乘以相应激活;将第一权重乘以第一激活包括:在第一乘法器中将第一权重乘以第一激活的最低有效部分;将第二权重乘以第二激活包括:在第二乘法器中将第二权重乘以第二激活的最低有效部分;以及在共享的乘法器中将第二权重乘以第二激活的最高有效部分,该共享的乘法器与激活阵列的多个行相关联。

    部分和压缩
    4.
    发明公开
    部分和压缩 审中-实审

    公开(公告)号:CN115511045A

    公开(公告)日:2022-12-23

    申请号:CN202210712346.9

    申请日:2022-06-22

    Abstract: 一种用于执行神经网络操作的方法。在一些实施例中,该方法包括:计算第一多个乘积,第一多个乘积中的每一个是权重和激活的乘积;计算第一部分和,第一部分和是乘积的和;以及压缩第一部分和以形成第一压缩的部分和。

    神经处理单元核心及配置神经处理单元核心的方法

    公开(公告)号:CN115511065A

    公开(公告)日:2022-12-23

    申请号:CN202210704687.1

    申请日:2022-06-21

    Abstract: 提供了神经处理单元核心及配置神经处理单元核心的方法。神经处理单元的核心被配置为通过使用加法器树最大化空间特征图局部性来高效地处理深度卷积。激活和权重的数据路径被反转,沿着乘法器的行,每2/9个乘法器就有2对1复用器。在深度卷积运算期间,核心使用RSxHW数据流进行操作,以最大化特征图局部性。对于常规卷积运算,激活和权重的数据路径可配置为常规卷积配置,并且且其中复用器空闲。

Patent Agency Ranking