一种基于动态激活位稀疏的神经网络加速器设计方法

    公开(公告)号:CN113705794A

    公开(公告)日:2021-11-26

    申请号:CN202111048239.2

    申请日:2021-09-08

    Abstract: 本发明公开了一种基于动态激活位稀疏的神经网络加速器设计方法,涉及深度神经网络加速器设计领域,包括神经网络加速器的架构、计算阵列组织方式、神经网络加速器中稀疏性数据的表达形式,所述神经网络加速器的架构包括DRAM连接、加载Load单元、有效位检测阵列单元、激活位稀疏计算阵列以及写回Store单元,及有这些单元间的连接形式和数据流方式;所述计算阵列组织方式是指通过对激活数据进行分组,以及组内交叉计算,组间同步计算的组织方式;所述神经网络加速器中稀疏性数据的表达形式是指设计激活数据的检测方式和数据表达形式。本发明提出了一种动态激活位稀疏的神经网络加速器设计方法,并针对激活有效位的数量不平衡问题进行了优化设计。

    传输系统
    22.
    发明授权

    公开(公告)号:CN110059041B

    公开(公告)日:2021-09-28

    申请号:CN201910222966.2

    申请日:2019-03-22

    Abstract: 本发明传输系统,包括相互连接的发送电路和接收电路;发送电路至少包括一时钟产生电路,接收电路至少包括一时钟恢复电路,时钟产生电路与时钟恢复电路相互耦合;其中时钟产生电路包括多个相互耦合的发送自定时振荡环;时钟恢复电路包括多个相互耦合的接收自定时振荡环。与现有技术相比,本发明具有如下的有益效果:可以提高发送端和接收端时钟的同步性能,减少接收电路设计的复杂性。

    一种面向忆阻器加速器的神经网络模型压缩方法及系统

    公开(公告)号:CN113052307A

    公开(公告)日:2021-06-29

    申请号:CN202110281982.6

    申请日:2021-03-16

    Abstract: 本发明提供了一种面向忆阻器加速器的神经网络模型压缩方法及系统,涉及基于忆阻器的神经网络加速器技术领域,该方法包括:步骤1:通过阵列感知的规则化增量剪枝算法,裁剪原始网络模型获得忆阻器阵列友好的规则化稀疏模型;步骤2:通过二的幂次量化算法,降低ADC精度需求和忆阻器阵列中低阻值器件个数以总体降低系统功耗。本发明能够解决原始模型映射到忆阻器加速器上时硬件资源消耗过大的问题以及ADC单元和计算阵列功耗过高的问题。

    一种基于数据流解耦的可重构阵列映射方法

    公开(公告)号:CN112612744A

    公开(公告)日:2021-04-06

    申请号:CN202011471974.X

    申请日:2020-12-14

    Abstract: 本发明公开了一种基于数据流解耦的可重构阵列映射方法,涉及可重构阵列的映射布局领域,首先,在原始DFG(Data Flow Graph,数据流图)中执行速率失配的区域间加入DE(Decouple Element,解耦单元),对数据流进行解耦;其次,利用一种“局部紧密,全局稀疏”的分簇式互连结构,将解耦后的所述数据流分隔在若干个规则的互连区域内;最后,通过一种分布式多阶段的布局算法,对每块所述互连区域内的所述数据流进行物理布局。本发明可以提高阵列的执行效率,完成了各种类型的单元的高效映射,并提升布局的速度和质量。

    基于TDC的低资源消耗分辨率可调时间测量统计系统及方法

    公开(公告)号:CN112486008A

    公开(公告)日:2021-03-12

    申请号:CN202011443031.6

    申请日:2020-12-11

    Abstract: 本发明提供了一种基于TDC的低资源消耗分辨率可调时间测量统计系统及方法,包括:TDC模块、采样模块、统计模块以及控制模块;所述TDC模块与采样模块相连;所述统计模块与采样模块相连;所述控制模块与TDC模块、采样模块、统计模块分别相连;所述控制模块能够完成TDC模块的初始化;所述控制模块能够对统计模块中分仓寄存单元和存储单元的读写时序进行控制。本发明的测量分辨率可调,单次测量能够完成数百个stop信号采样。另外,统计模块中采用的分仓统计和定时筛选存储方法降低了硬件资源消耗,适合应用中多路测量的需求。

    传输系统
    26.
    发明公开

    公开(公告)号:CN110059041A

    公开(公告)日:2019-07-26

    申请号:CN201910222966.2

    申请日:2019-03-22

    Abstract: 本发明传输系统,包括相互连接的发送电路和接收电路;发送电路至少包括一时钟产生电路,接收电路至少包括一时钟恢复电路,时钟产生电路与时钟恢复电路相互耦合;其中时钟产生电路包括多个相互耦合的发送自定时振荡环;时钟恢复电路包括多个相互耦合的接收自定时振荡环。与现有技术相比,本发明具有如下的有益效果:可以提高发送端和接收端时钟的同步性能,减少接收电路设计的复杂性。

    基于错误快速定位的FPGA软错误刷新方法以及刷新器

    公开(公告)号:CN109542670A

    公开(公告)日:2019-03-29

    申请号:CN201811440818.X

    申请日:2018-11-29

    Abstract: 本发明提供了一种基于错误快速定位的FPGA软错误刷新方法,包括如下步骤:步骤S1,识别电路设计中软错误高敏感的部分;步骤S2,对软错误高敏感的部分进行备份,并获取比较器输出与发生软错误配置存储器之间的位置信息对应关系,即进行软错误定位;步骤S3,在FPGA上存储获取的位置信息对应关系,在实际电路运行时利用刷新器硬件解析比较器输出,获得发生软错误配置存储器的位置信息,从而进行错误的准确定位和刷新。同时提供了一种刷新器。采取的随机故障注入结果显示,对所有电路进行保护的情况下,本发明平均有16%的软错误缓解性能提升,平均缩短了45%的电路平均错误检测时间,实现了对电路软错误的有效保护。

    一种内嵌于忆阻器阵列的逻辑运算装置的计算方法

    公开(公告)号:CN109521995A

    公开(公告)日:2019-03-26

    申请号:CN201811299080.X

    申请日:2018-11-02

    Abstract: 本发明公开了一种内嵌于忆阻器阵列的逻辑运算装置的计算方法,利用反向连接的差分单元结构实现互补形式的输入表示,利用阵列本身在位线上的“线或”操作实现最大项;通过将敏感放大器输出的最大项取反得到最小项;引入运算单元CU完成最大项或最小项的合并;所述利用运算单元CU缓存迭代过程中产生的中间结果的方法为:复用传统存储阵列中的行缓冲,用于在运算过程中缓存迭代产生的中间结果。本发明通过差分单元结构及运算单元的引入,丰富了逻辑原语,使电路以“积之和/和之积”的方式进行运算,同时大幅减少写回操作,从而有效的提高的运算效率。

    高效的粗粒度可重构计算系统

    公开(公告)号:CN105468568B

    公开(公告)日:2018-06-05

    申请号:CN201510779977.2

    申请日:2015-11-13

    Abstract: 本发明公开了一种粗粒度可重构计算系统,用于执行应用程序的源代码的串行执行部分和并行执行部分,其中的并行执行部分被转换为配置信息。本发明包括通用处理器核、粗粒度可重构阵列、主存储器、共享存储器和配置信息存储器。粗粒度可重构阵列执行该并行执行部分,包括成阵列排布的多个执行单元;各执行单元包括三个多路复用器、运算器和寄存器堆,多路复用器接收输入数据,运算器执行运算并将运算结果输出到阵列之外、输出到下一行的任意一个执行单元中以及输出到寄存器堆。本发明的粗粒度可重构计算系统适用的应用类型广,硬件代价低且能保证良好的性能,节省了配置时间,提升了效率。

    基于动态例化的纠错存内计算系统、方法及设备

    公开(公告)号:CN120011133A

    公开(公告)日:2025-05-16

    申请号:CN202510496784.X

    申请日:2025-04-21

    Abstract: 本发明提供了一种基于动态例化的纠错存内计算系统、方法及设备,属于存内计算技术领域,所述系统包括存内计算输入模块、纠错存内计算模块、存内计算输出模块;所述存内计算输入模块用于将特征值划分,并生成奇偶校验比特;在纠错存内计算模块中,由片上抗辐射MRAM单元将权重发送至例化存内计算单元,与特征值进行存内计算,计算结果发送至结果判决单元,若奇偶校验正确则输出结果,若奇偶校验不正确则新增例化存内计算单元用于输出正确结果;存内计算输出模块用于接收纠错存内计算模块的输出结果以获得输出特征值。本发明支持存内计算单元的灵活动态例化,根据计算结果进行例化或释放硬件资源,增强存内计算系统的灵活性和系统性能。

Patent Agency Ranking