一种面向宽度优先搜索算法的加速装置、方法及存储介质

    公开(公告)号:CN109992413B

    公开(公告)日:2021-09-24

    申请号:CN201910155053.3

    申请日:2019-03-01

    Abstract: 本发明涉及一种面向宽度优先搜索算法的加速装置、方法及存储介质,其中,该装置包括:内存模块,用于存储图数据与搜索结果;执行单元模块,用于根据所述面向宽度优先搜索算法的内在特征,构架多级流水线以执行遍历搜索任务;访存复用模块,用于根据设定的优先级处理所述流水线的访存请求;调度模块,用于将所述内存模块的响应数据分发到空闲的执行单元;控制模块用于控制与管理所述各个模块。该方法与装置可以提高图数据处理的计算效率。

    基于数据流架构的稀疏神经网络的运算方法

    公开(公告)号:CN113313247A

    公开(公告)日:2021-08-27

    申请号:CN202110161624.1

    申请日:2021-02-05

    Abstract: 本发明提供了一种基于数据流架构的稀疏神经网络的运算方法,包括:依据数据流处理器的结构将稀疏神经网络的运算任务从低到高依次划分为子任务、任务和应用三个运算层级;确定所述运算层级中每个所述任务包含的所述子任务的个数、每个所述应用包含的所述任务的个数以及所述应用的个数,其中所述稀疏神经网络的输入图像数据和权重数据至少之一是稀疏矩阵;依据所述运算层级以及各个运算层级的个数,将所述稀疏神经网络的输入图像数据或权重数据划分为若干数据块;以及基于所述运算层级以及每个运算层级对应的数据块完成所述稀疏神经网络的运算任务。

    一种基于数据流架构的多精度神经网络计算装置以及方法

    公开(公告)号:CN113298245A

    公开(公告)日:2021-08-24

    申请号:CN202110631644.0

    申请日:2021-06-07

    Abstract: 本发明实施例提供了一种基于数据流架构的多精度神经网络计算装置,包括:微控制器以及与之连接的PE阵列,PE阵列的每个PE中配置有原始精度和精度低于原始精度的多种低精度的计算部件,精度越低的计算部件中配置越多并行的乘法累加器以充分利用片上网络带宽,为每个PE中每种低精度的计算部件配置充足的寄存器以避免数据溢出;所述微控制器被配置为:响应于对特定卷积神经网络的加速请求,控制PE阵列中与所述特定卷积神经网络精度匹配的原始精度或者低精度的计算部件执行相应的卷积操作中的运算并将中间计算结果存储至相应的寄存器。从而可以为不同精度的卷积神经网络进行加速,降低计算时延和能耗,提高用户体验。

    一种用于区块链的处理装置及方法

    公开(公告)号:CN110211618B

    公开(公告)日:2021-08-24

    申请号:CN201910505407.2

    申请日:2019-06-12

    Abstract: 本发明提供了一种用于区块链的处理装置及方法,该装置包括:阻变存储器,其包括用于存储待处理的随机数的多个存储单元,以及用于读出或者写入数据位的字线和位线;字线控制逻辑,用于控制阻变存储器中字线的选通;位线控制逻辑,用于控制阻变存储器中位线的选通;数据获取单元,其连接到所述阻变存储器并用于从阻变存储器中接收所选通的字线上的随机数的一个或者多个数据位的输出,获得由所述字线选通的随机数的数据位的叠加值;计算及控制单元,被配置为根据数据获取单元生成的随机数数据位的叠加值进行随机数的筛选,获得随机数有效组。本发明可以减少CPU处理的数据的范围和数据量、对访存带宽的需求、计算负载、功耗,提高区块链应用处理能力。

    一种超导并行寄存器堆装置

    公开(公告)号:CN112114875A

    公开(公告)日:2020-12-22

    申请号:CN202010876462.5

    申请日:2020-08-27

    Abstract: 提供一种超导并行寄存器堆装置,该装置包括N个寄存器组,其中N为大于等于2的整数,该N个寄存器组分别包括用于接收数据输入的数据输入端,用于接收写数据地址的写地址输入端,用于接收写使能信号的写使能端,用于接收时钟信号的时钟输入端,用于接收读数据地址的读地址输入端以及用于将数据输出的数据输出端;其中,该N个寄存器组的数据输入端连接在一起,该N个寄存器组的写地址输入端连接在一起,以及该N个寄存器组的写使能端连接在一起。

    一种卷积神经网络的加速方法及装置

    公开(公告)号:CN112036551A

    公开(公告)日:2020-12-04

    申请号:CN202010995617.7

    申请日:2020-09-21

    Abstract: 本发明提出一种一种卷积神经网络的加速方法,其特征在于,包括:步骤1、根据权值大小对权重矩阵进行降序排列,并记录降序排列前的权值索引;步骤2、利用降序排列后的权重矩阵与特征矩阵进行乘累加运算;步骤3、判断所述乘累加运算的结果是否小于零,如是,则结束运算,如否,则继续步骤2的运算,直至得出最后运算结果。本发明能够有效减少卷积神经网络中的无效计算,一方面可以提高神经网络的计算速度,提高加速器、芯片的性能;另一方面,无效计算的减少还能降低芯片的能耗。

    生成面向超导RSFQ电路的多扇出时钟信号的方法

    公开(公告)号:CN111950215A

    公开(公告)日:2020-11-17

    申请号:CN202010703091.0

    申请日:2020-07-21

    Abstract: 提供一种生成面向超导RSFQ电路的多扇出时钟信号的方法,其中N是扇出时钟信号的数量,N个扇出时钟信号的每一个与从时钟源点到时钟端点所经过的由SPL构成的分支路径相对应,由SPL构成的分支路径构成SPL树,所述方法包括:建立高度P为1的SPL树,将其存入集合R;根据N计算SPL树的最大高度Pmax;自底向上逐层建立SPL树,每次迭代P增加1,直到P>Pmax,并将所得到的SPL树存入集合R中;选择所述集合R中叶节点数为N的树构成最优解;根据所述最优解确定多扇出时钟信号的由SPL构成的分支路径;其中,高度为P的树是由所述集合R中高度为P-1的子树组成的。

    基于数据流架构的快速傅里叶变换方法、系统和存储介质

    公开(公告)号:CN110008436A

    公开(公告)日:2019-07-12

    申请号:CN201910171401.6

    申请日:2019-03-07

    Abstract: 本发明涉及一种基于数据流架构的快速傅里叶变换方法、系统和存储介质,包括:从X个源操作数中按照码位倒置顺序载入2(log2X-log2Y)个源操作数和旋转因子,Y为处理单元数,以在处理单元本地完成log2X-log2Y层蝶形运算,得到运算结果;设运算层数Q=1;将Y个处理单元标号分别对应1至Y,保存各处理单元与标号的对应关系构成序列表,序列表中有标识位,初始化所有处理单元标识位都为true;在序列表中选择标号最小且标识位为true的处理单元PEi,将其与编号为i+2Q-1的处理单元构成交换对,并将交换对中两个PE的标志位更改为false;直到所有处理单元标识位均为false,各交换对包括的处理单元间交换运算结果以完成一层蝶形运算,Q自加1;直到Q为log2X时输出运算结果。

Patent Agency Ranking