一种可参数化生成并动态可配置的神经网络硬件加速结构

    公开(公告)号:CN116933850A

    公开(公告)日:2023-10-24

    申请号:CN202210345931.X

    申请日:2022-03-31

    Applicant: 南京大学

    Abstract: 本申请提供一种可参数化生成并动态可配置的神经网络硬件加速结构,包括控制分发模块从控制核接收控制信息,从片外存储读取指令数据至多个指令队列;加载存储模块从片外存储加载计算输入至片上存储模块,将计算结果传输至片外存储;片上存储模块负责暂存数据;张量计算模块从片上存储模块读取数据并完成张量计算,将计算结果存储至片上存储模块;矢量计算模块从片上存储模块读取数据并完成矢量计算,将计算结果存储至片上存储模块。该硬件加速结构通过参数化生成匹配不同的硬件约束,对硬件资源合理分配,通过动态配置支持不同的神经网络计算任务,优化计算与数据访存的配合,实现对于神经网络计算的高效加速,并支持多种计算功能。

Patent Agency Ranking