神经网络压缩方法及装置
    1.
    发明公开

    公开(公告)号:CN113570037A

    公开(公告)日:2021-10-29

    申请号:CN202110791944.5

    申请日:2021-07-13

    Applicant: 清华大学

    Abstract: 本发明提供一种神经网络压缩方法及装置,方法包括:将目标加速器内载的神经网络作为环境,以确定压缩超参数组合;将压缩超参数组合作为动作,对神经网络进行压缩,以确定压缩神经网络后的奖励值;根据压缩后的神经网络,对环境、压缩超参数组合、动作和奖励值进行更新,并在满足预设条件时,停止更新;根据最后一次更新后的压缩超参数组合,对神经网络进行压缩。所述装置用于执行上述方法。本发明提供的神经网络压缩方法及装置,通过对加速器进行分析,得到适合于该加速架构的压缩超参数组合,从而比传统非自适应压缩更加有效地降低神经网络在加速器上的计算开销,提高神经网络在加速器上的推理过程能效。

    基于乒乓缓冲的存内计算系统及方法

    公开(公告)号:CN112486901B

    公开(公告)日:2024-09-24

    申请号:CN202011382184.4

    申请日:2020-11-30

    Applicant: 清华大学

    Abstract: 本发明提供一种基于乒乓缓冲的存内计算系统及方法,该系统包括数据获取模块、存内计算模块和计算结果存储模块,其中:数据获取模块,用于获取多组第一输入数据,并将多组第一输入数据发送到存内计算模块;存内计算模块中设置有乒乓缓冲单元,用于对多组第一输入数据同时进行写入存储和存内计算,其中,乒乓缓冲单元是由两个乒乓缓冲区域组成的,乒乓缓冲区域具有写入存储功能和存内计算功能,且写入存储功能和存内计算功能,在两个乒乓缓冲区域之间,通过乒乓轮换方式进行切换;计算结果存储模块,用于存储存内计算得到的计算结果。本发明能够同时支持存内计算操作和更新权重操作,从而降低更新权重时对于存内计算性能的影响。

    基于内容寻址存储器的不规则数据存储访问方法、装置

    公开(公告)号:CN118034586A

    公开(公告)日:2024-05-14

    申请号:CN202410071026.9

    申请日:2024-01-17

    Applicant: 清华大学

    Abstract: 本发明公开了一种基于内容寻址存储器的不规则数据存储访问方法、装置,该方法包括:将数据点的编码值存放到内容寻址存储器CAM中,将数据点坐标和数据点特征分别存放到两个静态随机存取存储器SRAM中;对于每一个待计算的数据点,根据数据点的坐标查询CAM并返回比特图;根据比特图确定检索数据点坐标和数据点特征的索引;根据检索出的坐标或特征通过相应的计算阵列执行相关运算,将运算结果存储到SRAM中;继续查询下一个待计算的数据点,直至所有待计算的点都计算完成。本发明解决了现有技术中不规则存储访问存在空间严重浪费、功耗高、耗时多等问题。

    实现加速的存内计算架构及其加速方法

    公开(公告)号:CN111026700B

    公开(公告)日:2022-02-01

    申请号:CN201911150139.3

    申请日:2019-11-21

    Applicant: 清华大学

    Abstract: 本发明实施例提供一种实现加速的存内计算架构及其加速方法,其中该架构包括:存储单元阵列,包含多个存储单元,用于存储神经网络模型的权重,每行所述存储单元的输入端口对应设置有数模转换单元;稀疏检测模块,连接所述数模转换单元的输入端口,用于根据神经网络算法确定的阈值,对输入所述存储单元阵列的数据进行稀疏检测,以确定输入数据的稀疏程度;运算模块,用于根据所述稀疏程度,动态调整存内计算的运行方式,实现存内计算的稀疏加速。本发明实施例通过增加对输入图像稀疏程度的在线检测模块,根据输入图像的稀疏度,动态调整存内计算的运行方式,能够通过有效利用输入数据的稀疏特性,实现存内计算在神经网络算法应用中的有效加速。

    基于乒乓缓冲的存内计算系统及方法

    公开(公告)号:CN112486901A

    公开(公告)日:2021-03-12

    申请号:CN202011382184.4

    申请日:2020-11-30

    Applicant: 清华大学

    Abstract: 本发明提供一种基于乒乓缓冲的存内计算系统及方法,该系统包括数据获取模块、存内计算模块和计算结果存储模块,其中:数据获取模块,用于获取多组第一输入数据,并将多组第一输入数据发送到存内计算模块;存内计算模块中设置有乒乓缓冲单元,用于对多组第一输入数据同时进行写入存储和存内计算,其中,乒乓缓冲单元是由两个乒乓缓冲区域组成的,乒乓缓冲区域具有写入存储功能和存内计算功能,且写入存储功能和存内计算功能,在两个乒乓缓冲区域之间,通过乒乓轮换方式进行切换;计算结果存储模块,用于存储存内计算得到的计算结果。本发明能够同时支持存内计算操作和更新权重操作,从而降低更新权重时对于存内计算性能的影响。

    一种高能效点云神经网络推理方法和装置

    公开(公告)号:CN116306774A

    公开(公告)日:2023-06-23

    申请号:CN202310111429.7

    申请日:2023-02-03

    Applicant: 清华大学

    Abstract: 本发明提供一种高能效点云神经网络推理方法和装置,依赖基于语义重要性预测的量化位宽分配算法实现点云神经网络的量化,由于引入了语义重要性预测,从而对语义关键点保留较高的量化位宽而对语义不关键点尽可能降低量化位宽,可保证量化后网络的最终精度不降低或者降低幅度非常微小的前提下大大降低网络的平均量化位宽。此外还利用点云数据集对量化的点云神经网络的精度和计算能效进行评估,在量化的点云神经网络的精度和计算能效其一达不到预期目标的情况下,重新量化点云神经网络,反复迭代以使精度和计算能效均达到预期目标。这样量化出的点云神经网络具有高推理能效。

    实现加速的存内计算架构及其加速方法

    公开(公告)号:CN111026700A

    公开(公告)日:2020-04-17

    申请号:CN201911150139.3

    申请日:2019-11-21

    Applicant: 清华大学

    Abstract: 本发明实施例提供一种实现加速的存内计算架构及其加速方法,其中该架构包括:存储单元阵列,包含多个存储单元,用于存储神经网络模型的权重,每行所述存储单元的输入端口对应设置有数模转换单元;稀疏检测模块,连接所述数模转换单元的输入端口,用于根据神经网络算法确定的阈值,对输入所述存储单元阵列的数据进行稀疏检测,以确定输入数据的稀疏程度;运算模块,用于根据所述稀疏程度,动态调整存内计算的运行方式,实现存内计算的稀疏加速。本发明实施例通过增加对输入图像稀疏程度的在线检测模块,根据输入图像的稀疏度,动态调整存内计算的运行方式,能够通过有效利用输入数据的稀疏特性,实现存内计算在神经网络算法应用中的有效加速。

Patent Agency Ranking