一种面向大数据的加速排序装置、方法、芯片、处理器

    公开(公告)号:CN106250097A

    公开(公告)日:2016-12-21

    申请号:CN201610460936.1

    申请日:2016-06-22

    CPC classification number: G06F7/24

    Abstract: 本发明提出一种面向大数据的加速排序装置、方法、芯片、处理器,涉及处理器设计领域,该方法对待排序列数据,每次取连续n位数据,取m组,并存放在所述寄存器组中;分别对m组所述待排序列数据进行排序,生成m组有序序列数据,通过排序算法将所述有序序列数据进行排序。本发明将所有与比较相关的排序算法复杂度降为原来的1/n;同时,这种n单元数据的连续访存,一定程度降低了访存开销,从而大大的提高了排序算法的执行速度,通过本发明,提高了单个节点处理器上针对排序应用的处理效率。

    一种改善数据在缓存中空间局部性的缓存方法及装置

    公开(公告)号:CN106126440A

    公开(公告)日:2016-11-16

    申请号:CN201610459904.X

    申请日:2016-06-22

    CPC classification number: G06F12/0811 G06F12/0897

    Abstract: 本发明提出一种改善数据在缓存中空间局部性的缓存方法及装置,涉及高速缓存技术领域,该方法包括设置主缓存与辅缓存,当进行访存操作时,先访问所述主缓存,从访存地址中解析出索引域,根据所述索引域定位所述主缓存中的组相联缓存块;检查所述组相联缓存块的有效位,判断是否命中,若命中,则从命中的缓存块中获取欲访问的数据,否则访问辅缓存,判断是否命中,若命中,从所述辅缓存中获取所述欲访问的数据;若所述辅缓存未命中,则从内存中获取所述欲访问的数据,并将所述欲访问的数据所在的数据块复制到所述主缓存中,将内存中与所述欲访问的数据空间局部性关系最好的数据块复制到所述辅缓存中。

    一种基于数据流架构的深度可分离卷积融合方法及系统

    公开(公告)号:CN113313251B

    公开(公告)日:2023-05-23

    申请号:CN202110522385.8

    申请日:2021-05-13

    Abstract: 本发明提出一种基于数据流架构的深度可分离卷积融合方法和系统,包括:将输入图像数据、卷积参数从主存DRAM搬运到数据缓存SPM;PE阵列通过从数据缓存SPM中读取该输入图像数据、卷积参数,以执行DW卷积,并将得到的DW卷积结果存储在PE内的寄存器中;PE阵列对寄存器中DW卷积结果进行激活计算得到该输入图像数据的初步结果Act_out,将该初步结果Act_out写回数据缓存SPM后,进一步存回主存;PE阵列通过从数据缓存SPM中读取初步结果Act_out与卷积参数,执行PW卷积得到最终结果Output;将最终结果Output写回数据缓存SPM后,进一步存回主存DRAM。本发明减少了数据的存储与访问带来的开销,使得深度可分离式卷积计算在数据流架构上的计算实现加速。

    生成面向超导RSFQ电路的多扇出时钟信号的方法

    公开(公告)号:CN111950215B

    公开(公告)日:2023-04-28

    申请号:CN202010703091.0

    申请日:2020-07-21

    Abstract: 提供一种生成面向超导RSFQ电路的多扇出时钟信号的方法,其中N是扇出时钟信号的数量,N个扇出时钟信号的每一个与从时钟源点到时钟端点所经过的由SPL构成的分支路径相对应,由SPL构成的分支路径构成SPL树,所述方法包括:建立高度P为1的SPL树,将其存入集合R;根据N计算SPL树的最大高度Pmax;自底向上逐层建立SPL树,每次迭代P增加1,直到P>Pmax,并将所得到的SPL树存入集合R中;选择所述集合R中叶节点数为N的树构成最优解;根据所述最优解确定多扇出时钟信号的由SPL构成的分支路径;其中,高度为P的树是由所述集合R中高度为P‑1的子树组成的。

    超导处理器及其输入输出控制模块

    公开(公告)号:CN112861463B

    公开(公告)日:2023-04-25

    申请号:CN202110266205.4

    申请日:2021-03-11

    Abstract: 提供一种用于超导处理器的输入输出控制模块,包括:取指令状态寄存器,用于指示取指令状态或者非取指令状态,以及用于将指令地址输出到内存;读数据等待状态寄存器,用于根据处理器的读数据请求以及取指令状态寄存器由取指令状态转换至非取指令状态,将读数据地址由暂存转换为输出到内存;读数据状态寄存器,用于指示读数据状态,以及用于将读数据地址输出到内存;写数据等待状态寄存器,用于根据处理器的写数据请求以及取指令状态寄存器由取指令状态转换至非取指令状态,将写数据地址和写数据内容由暂存转换为输出到内存;写数据状态寄存器,用于指示写数据状态,以及用于将写数据地址和写数据内容输出到内存。

    一种超导流水线电路及处理器

    公开(公告)号:CN112116094B

    公开(公告)日:2022-08-30

    申请号:CN202010875646.X

    申请日:2020-08-27

    Abstract: 提供一种超导流水线电路,至少包括:第一可清零寄存器组、第一逻辑组合电路、第二可清零寄存器组以及第二逻辑组合电路,其中第一和第二可清零寄存器组用于在使能信号的控制下接收数据输入,并在第一时钟的控制下,将接收的输入数据进行输出;第一逻辑组合电路接收第一可清零寄存器组的输出数据,并在第一时钟的控制下将该数据运算之后输出至第二可清零寄存器组;第二逻辑组合电路接收第二可清零寄存器组的输出数据,并在第一时钟的控制下将该数据运算之后进行输出;其中,第二逻辑组合电路还用于生成内部清零信号以及阻塞信号;阻塞信号用于控制使能信号的有效和无效,以及内部清零信号用于控制第一和第二可清零寄存器组清零。

    一种用于分布式训练计算阶段的自动优化方法

    公开(公告)号:CN114911621A

    公开(公告)日:2022-08-16

    申请号:CN202210553734.7

    申请日:2022-05-20

    Abstract: 本发明提供一种用于分布式训练计算阶段的自动优化方法,所述方法包括在分布式训练的每个回合执行如下步骤:S1、以预设的最小单位负载为粒度,计算当前回合中参与分布式训练的所有节点的计算性能;S2、以计算性能最差的节点计算其对应的最大允许负载数的完成时间为限制时间,分别计算每个节点在限制时间内能够完成计算的最大负载数,以所有节点在限制时间内对应的能够完成计算的最大负载数组成负载分配策略;S3、以步骤S2中负载分配策略,分配下一回合每个计算节点的负载。其中,节点的计算性能是该节点完成预设最小单位负载计算的时间。

    一种片上SRAM阵列存储装置及AI神经网络图像数据存储方法

    公开(公告)号:CN114860169A

    公开(公告)日:2022-08-05

    申请号:CN202210510935.9

    申请日:2022-05-11

    Abstract: 本发明提供一种片上SRAM阵列存储装置,所述装置包括多个并列的bank块,每个bank块包括数量相同的连续的多个SRAM单元,每个SRAM单元包括连续的多行存储空间,不同bank块中的同一位置的SRAM单元组成一个SRAM单元行,其中,各个bank块中的各个SRAM单元按照如下方式进行编址:以第一个SRAM单元行中的第一个SRAM单元为起点进行顺序编址,以使相邻地址分散在不同bank块中;相邻SRAM单元行中,后一个SRAM单元行的第一个SRAM单元在前一个SRAM单元行的最后一个SRAM单元的地址的基础上顺序编址。

    一种数据转发装置及方法
    10.
    发明公开

    公开(公告)号:CN114629555A

    公开(公告)日:2022-06-14

    申请号:CN202210310677.X

    申请日:2022-03-28

    Abstract: 本发明提供了一种数据转发装置,其输入端与输出端均与传输光纤相连,所述装置包括:光纤分路器,将输入的光信号复制为多份光信号;光直通转发模块,接收光纤分路器的一条分路输出的光信号并将需要转发的光信号直接以光信号形式经过光纤选路器传输到输出端的传输光纤;光电转换模块,接收光纤分路器的一条分路输出的光信号并转换为电信号且以数据包形式进行缓存;控制模块,接收光纤分路器的一条分路输出的光信号,以根据光信号的目的地址判断光信号是否需要转发,并结合输出端传输光纤的工作状态针对需要转发和不需要转发的光信号分别输出相应的控制命令;光纤选路器,在控制模块输出的控制下选择光直通转发模块或光电转换模块与输出端传输光纤连通。

Patent Agency Ranking