电路单元及具有其的电路阵列

    公开(公告)号:CN111462791A

    公开(公告)日:2020-07-28

    申请号:CN202010162766.5

    申请日:2020-03-10

    Applicant: 清华大学

    Abstract: 本发明公开了一种电路单元及具有其的电路阵列,所述电路单元包括:第一开关,第二开关和数据存储器。所述第一开关包括第一输入端和第一输出端;所述第二开关包括第二输入端和第二输出端;所述数据存储器包括第一端口、第二端口和第三端口,所述第三端口可改变所述数据存储器中的存储数据,所述第三端口和所述存储数据可控制所述第一端口和所述第二端口,所述第一输出端和所述第二输出端均与所述第三端口相连。根据本发明的电路单元一方面可以实现零静态功耗,进而可以更好的存储数据,防止数据丢失;另一方面具有更高的存储密度,从而有利于提升存储带宽。

    模拟缓存器电路
    22.
    发明授权

    公开(公告)号:CN107886980B

    公开(公告)日:2020-05-05

    申请号:CN201711141680.9

    申请日:2017-11-16

    Applicant: 清华大学

    Abstract: 本公开提供了一种模拟缓存器电路,包括:第一源极跟随器M1;以及第二源极跟随器M2,所述第二源极跟随器M2与所述第一源极跟随器M1串联,其中,所述第一源极跟随器M1的栅极以及所述第二源极跟随器M2的栅极并联连接到信号输入端,所述第一源极跟随器M1的源极与所述第二源极跟随器M2的漏极连接,所述第二源极跟随器M2的源极与信号输出端连接。

    支持权重稀疏的存内计算架构及其数据输出方法

    公开(公告)号:CN111079919A

    公开(公告)日:2020-04-28

    申请号:CN201911151228.X

    申请日:2019-11-21

    Applicant: 清华大学

    Abstract: 本发明实施例提供一种支持权重稀疏的存内计算架构及其数据输出方法,其中该架构包括:存储单元阵列,包含多个子存储单元块,每列所述子存储单元块的输出端口对应设置有模数转换单元;运算模块,用于按照各所述子存储单元块,对所述存储单元阵列中存储的神经网络模型权重进行稀疏训练,使得每个所述子存储单元块中存储的权重被训练为全零值或非全零值;检测模块,用于当检测到所述模数转换单元对应的所述子存储单元块处于工作状态且存储的权重为全零值时,关断所述模数转换单元,并将所述模数转换单元的输出置为零。本发明实施例能够有效降低存内计算在神经网络模型权重稀疏应用中的功耗,提高应用的可行性。

    实现加速的存内计算架构及其加速方法

    公开(公告)号:CN111026700A

    公开(公告)日:2020-04-17

    申请号:CN201911150139.3

    申请日:2019-11-21

    Applicant: 清华大学

    Abstract: 本发明实施例提供一种实现加速的存内计算架构及其加速方法,其中该架构包括:存储单元阵列,包含多个存储单元,用于存储神经网络模型的权重,每行所述存储单元的输入端口对应设置有数模转换单元;稀疏检测模块,连接所述数模转换单元的输入端口,用于根据神经网络算法确定的阈值,对输入所述存储单元阵列的数据进行稀疏检测,以确定输入数据的稀疏程度;运算模块,用于根据所述稀疏程度,动态调整存内计算的运行方式,实现存内计算的稀疏加速。本发明实施例通过增加对输入图像稀疏程度的在线检测模块,根据输入图像的稀疏度,动态调整存内计算的运行方式,能够通过有效利用输入数据的稀疏特性,实现存内计算在神经网络算法应用中的有效加速。

    一种稀疏神经网络加速器及其实现方法

    公开(公告)号:CN110738310A

    公开(公告)日:2020-01-31

    申请号:CN201910950799.3

    申请日:2019-10-08

    Applicant: 清华大学

    Abstract: 本发明提供一种稀疏神经网络加速器及实现方法,加速器主要包括PE阵列、输出存储器和调度器模块,PE阵列被划分为多个PE组,每个PE组和对应的输出存储器组成一个关联组,关联组中PE的数量和输出存储器的数量相等;关联组中的每一个PE单元可访问关联组中的任一输出存储器;任一关联组中的PE单元,根据输入的激活值和权重值计算得到多个输出结果,并按预设规则写入对应多个输出存储器中;调度器模块调度输出激活值的顺序,降低哈希冲突的概率。本发明将原始PE阵列划分为多个PE组,与对应输出存储器形成关联组体系架构,大大降低输出内存的面积并降低功耗开销;调度器模块降低了哈希冲突的概率,极大提升了整个系统的计算性能。

    一种模拟神经网络处理器的误差校准方法及装置

    公开(公告)号:CN110580523A

    公开(公告)日:2019-12-17

    申请号:CN201810580960.8

    申请日:2018-06-07

    Applicant: 清华大学

    Abstract: 本发明实施例提供一种模拟神经网络处理器的误差校准方法及装置,所述方法包括:若检测到算法更新和/或误差参数调整,解析所述NN的网络结构,以获取所述网络结构中的全连接层的可训练权重参数;采用随机梯度下降SGD算法对所述可训练权重参数进行训练;其中,在学习过程中的损失值和梯度采用对数量化;所述学习过程是在数字域进行的;采用移位运算代替所述学习过程中的反向传播和可训练权重参数更新使用的乘法运算;存储学习好的权重参数,以供所述NN根据所述权重参数校准所述处理器的误差。所述装置执行上述方法。本发明实施例提供的模拟神经网络处理器的误差校准方法及装置,能够降低模拟NN处理器的能量和资源消耗,从而提高模拟NN处理器的效率。

    数据写入控制装置及方法
    27.
    发明公开

    公开(公告)号:CN110209346A

    公开(公告)日:2019-09-06

    申请号:CN201910189405.7

    申请日:2015-03-06

    Abstract: 一种数据写入控制装置及方法,当所述写入控制装置处于所述回写模式时,所述处理器侦测所述第一存储器中脏块的数量,当所述脏块的数量达到第一预设阈值时,分别预测在两种写入模式下,所述处理器所运行程序在一危险时间段内的执行进度,当预测在通写模式下所述处理器所运行程序在所述危险时间段内的执行进度大于在所述回写模式下所述处理器所运行程序在所述危险时间段内的执行进度时,将当前的数据写入模式转换为通写模式;当所述写入控制装置处于所述通写模式时,侦测所述脏块数量,当所述脏块的数量降至第二预设阈值时,则将当前的数据写入模式转换为所述回写模式。

    基于视觉测程的同时定位与地图构建方法

    公开(公告)号:CN105469405B

    公开(公告)日:2018-08-03

    申请号:CN201510845988.6

    申请日:2015-11-26

    Applicant: 清华大学

    Abstract: 本发明提出一种基于视觉测程的同时定位与地图构建方法,包括:采集双目图像并校正,得到无失真的双目图像;对无失真的双目图像进行特征点提取,生成特征点描述子;建立双目图像的特征点匹配关系;根据该匹配关系得到匹配特征点的水平视差,并结合双目图像捕获系统的参数计算空间真实深度;计算当前帧的特征点与世界地图中特征点匹配结果;去除其中错误匹配的特征点,得到成功匹配的特征点;计算成功匹配的特征点在世界坐标系下的坐标与当前参考坐标系下的三维坐标的变换矩阵,根据变换矩阵得到双目图像捕获系统相对初始位置的位姿变化估计值;建立及更新世界地图。本发明具有较低的计算复杂度,厘米级的定位精度及对位置估计的无偏特性。

    带比较器失调校正的六位异步逐次逼近模数转换器

    公开(公告)号:CN104242942B

    公开(公告)日:2017-10-27

    申请号:CN201410515545.6

    申请日:2014-09-29

    Applicant: 清华大学

    Abstract: 本发明公开了一种带比较器失调校正的六位异步逐次逼近模数转换器,包括:采样保持电路,对外部输入信号进行采样;数模转换器,产生基准电压;选通开关;比较器模块,其第一级比较器子模块根据选通开关输出的采样值和对应的基准电压生成第一级比较器输出数据,第二级比较器子模块根据控制信号、选通开关输出的对应的基准电压和采样值生成第二级比较器输出数据;输出数据译码模块用于对第一级比较器输出数据和第二级比较器输出数据进行译码,得到第一级输出数据和第二级输出数据;异步数字控制逻辑电路,根据第一级比较器输出数据生成控制信号。本发明的模数转换器可提高转换速度,并对比较器进行失调校正,可实现良好的性能。

    一种粗粒度可重构的卷积神经网络加速器及系统

    公开(公告)号:CN106951961A

    公开(公告)日:2017-07-14

    申请号:CN201710104029.8

    申请日:2017-02-24

    Applicant: 清华大学

    Abstract: 本发明提供一种粗粒度可重构的卷积神经网络加速器及系统,所述加速器包括多个处理单元簇,所述每个处理单元簇包括若干基本计算单元,所述若干基本计算单元通过一子加法单元连接,所述多个处理单元簇的子加法单元分别连接到一母加法单元;所述每个子加法单元用于产生相邻的若干基本加法单元的部分和,所述母加法单元用于累加所述子加法单元。本发明采用粗粒度可重配的方式,通过SRAM或其他互联单元链接不同的权重与图像轨道,以实现不同的卷积核处理结构,可以高效的支持不同太小的网络和卷积核,同时大量减少重新配置的开销。

Patent Agency Ranking