服务器上深度神经网络划分

    公开(公告)号:CN107710237B

    公开(公告)日:2021-08-06

    申请号:CN201680039131.8

    申请日:2016-06-24

    Abstract: 提供了一种用于在服务器部件上实现深度神经网络的方法,该服务器部件包括主机部件和耦合到主机部件的硬件加速部件,主机部件包括CPU。深度神经网络包括多个层。该方法包括将深度神经网络划分成第一片段和第二片段,第一片段包括多个层的第一子集,第二片段包括多个层的第二子集,配置主机部件来实现第一片段,并配置硬件加速部件来实现第二片段。

    硬件加速器上的卷积神经网络

    公开(公告)号:CN107836001A

    公开(公告)日:2018-03-23

    申请号:CN201680039028.3

    申请日:2016-06-27

    CPC classification number: G06N3/063 G06F15/7803 G06N3/04 G06N3/0454 G06F15/76

    Abstract: 提供一种用于实现卷积神经网络的硬件加速部件。该硬件加速部件包括N行功能单元和M列功能单元的阵列、存储输入数据的N个输入数据缓冲器以及存储权重数据的M个权重数据缓冲器。N个输入数据缓冲器中的每个输入数据缓冲器被耦合到N行功能单元中对应的一行功能单元。M个权重数据缓冲器中的每个权重数据缓冲器被耦合到M个功能单元列中对应的功能单元列。行中的每个功能单元接收相同的输入数据集合。列中的每个功能单元从耦合到该行的权重数据缓冲器接收相同的权重数据集合。功能单元中的每个功能单元对接收到的输入数据和接收到的权重数据执行卷积,并且M个功能单元列提供M个输出数据平面。

Patent Agency Ranking