一种基于RISC-V指令集拓展的加速计算装置及方法

    公开(公告)号:CN116245149A

    公开(公告)日:2023-06-09

    申请号:CN202211636249.2

    申请日:2022-12-20

    Applicant: 南京大学

    Abstract: 本申请提供了一种基于RISC‑V指令集拓展的加速计算装置与方法,包括:RISC‑V微处理器核模块,被配置为控制量化神经网络的读写,存储指令和小规模数据,进行取指操作,并生成自定义指令;协处理器核模块,被配置为执行来自RISC‑V微处理器核模块发送的自定义指令;存储模块,通过AXI总线与AXI互联设备相连接,其中,所述存储模块包括:DDR存储器,被配置为存储大批量的用于生成自定义指令的量化神经网络参数;DDR控制器,被配置为控制DDR存储器的读写,以解决目前的CNN模型的计算量以及参数量都十分庞大,导致模型在运行过程中需要占用大量内存,同时消耗超高算力的问题。

    一种基于深度神经网络处理器的计算处理方法及装置

    公开(公告)号:CN118133910A

    公开(公告)日:2024-06-04

    申请号:CN202410200492.2

    申请日:2024-02-23

    Applicant: 南京大学

    Abstract: 本申请提供一种基于深度神经网络处理器的计算处理方法及装置,所述方法包括:获取输入数据、权重数据以及指令流;根据输入数据构建预设输入矩阵,根据权重数据构建权重矩阵;响应于指令流,对预设输入矩阵做第一矩阵变换,得到输入矩阵;对输入矩阵和权重矩阵执行第一计算,得到输出矩阵;将输出矩阵传输至量化深度神经网络的下一层,以作为量化深度神经网络下一层的输入矩阵。上述方法中,构建预设输入矩阵和权重矩阵,可以适配可变精度的数据且同时适配脉动阵列,提高计算效率;对输入矩阵和权重矩阵执行第一计算,计算后得出的输出矩阵与输入矩阵形式类似,可以直接传递至下一层进行推理,无需变换,提高量化DNN处理器的性能及吞吐量。

    一种可变精度量化深度神经网络处理器及数据处理方法

    公开(公告)号:CN118133909A

    公开(公告)日:2024-06-04

    申请号:CN202410200414.2

    申请日:2024-02-23

    Applicant: 南京大学

    Abstract: 本申请提供一种可变精度量化深度神经网络处理器及数据处理方法,所述方法包括:从数据缓存单元获取待处理数据,待处理数据包括第一数据、第二数据和第三数据;根据第一数据选择可变精度乘法器和/或可变精度加法器的精度;通过脉动阵列对第二数据和第三数据执行乘累加计算得到输出数据,以及将输出数据输入到数据缓存单元。所述可变精度量化DNN处理器可以根据待处理数据中的第一数据选择不同的精度执行计算,达到适配不同精度数据的目的,且可变精度量化DNN处理器包括浮点乘法器、浮点加法器,可以实现第一浮点精度和第二浮点精度的计算,使可变精度量化DNN处理器支持片上训练,提高可变精度量化DNN处理器的吞吐量和能效比。

Patent Agency Ranking