一种实现负载均衡的稀疏神经网络近存推理加速器的方法

    公开(公告)号:CN118194939A

    公开(公告)日:2024-06-14

    申请号:CN202211608446.3

    申请日:2022-12-14

    Applicant: 复旦大学

    Inventor: 李紫絮 林殷茵

    Abstract: 本发明涉及近存计算、深度学习数据压缩技术领域,具体涉及一种实现负载均衡的稀疏神经网络近存推理加速器的方法。本方法包括:根据未压缩权重数据在基于动态随机存储器的近存加速器中数据存储的排布方式,将存储在同一个计算单元配置的存储模块中的数据作为权重稀疏训练设置的剪枝区域范围;根据数据存储排布方式设置的剪枝区域对权重进行稀疏训练,训练周期后将每个剪枝区域中低于特定阈值的数据修剪为零值,实现每个剪枝区域的权重数据稀疏程度相同;将训练的稀疏权重数据映射到配置的存储模块中,再将输入激活值广播到计算单元中,实现稀疏神经网络近存推理加速器计算单元间的负载均衡。本方法能解决片上加速器存储的延迟和带宽问题,实现稀疏网络在多个并行近存计算单元中的负载均衡调度,提高稀疏神经网络近存推理加速器的性能。

Patent Agency Ranking