-
公开(公告)号:CN118586453A
公开(公告)日:2024-09-03
申请号:CN202410762665.X
申请日:2024-06-13
Applicant: 南京大学
IPC: G06N3/0464 , G06N3/06 , G06F9/38
Abstract: 本申请提供一种基于RISC‑V的向量处理器及混合数据流方法,所述向量处理器包括:控制模块、加载存储模块、至少一个可拓展模块;可拓展模块包括:脉动阵列单元;控制模块被配置为:接收并解码向量指令,生成解码信息;将向量指令和解码信息发送至可拓展模块;加载存储模块被配置为:获取并存储计算数据,并根据向量指令将对应的计算数据分配至可拓展模块;计算数据包括:输入数据和权重数据;可拓展模块被配置为:基于计算数据,根据数据流映射信息,生成目标计算结果;以解决目前的深度神经网络架构限制了依赖于固定数据流进行推理的加速器在执行完整深度神经网络运算过程中的效率,导致深度神经网络整体的计算性能和能效较低的问题。
-
公开(公告)号:CN116483774A
公开(公告)日:2023-07-25
申请号:CN202310441735.7
申请日:2023-04-23
Applicant: 南京大学
Abstract: 本发明提供的一种兼容脉动阵列加速器的矢量处理器及处理方法,加入了脉动阵列加速器,并基于RISC‑V开源指令集自定义设计了专门的矢量指令调用脉动阵列加速器,用于实现矢量与矢量之间的计算。相比于原有的采用算术逻辑单元每个周期只能进行单个固定宽度的数据进行计算,脉动阵列加速器充分利用了原架构上的存储单元,增大了数据吞吐量,实现较多矢量数据的之间的计算,使得脉动阵列加速器的加速效果得到充分利用,计算利用率得到大幅提高。脉动阵列加速器可以支持多精度及超低比特量化计算,提高矢量计算的效率,同时矢量处理器的并行性和可拓展性可以极大地提高数据计算密度,从而实现算力的有效提升。
-
公开(公告)号:CN115936128A
公开(公告)日:2023-04-07
申请号:CN202211441900.0
申请日:2022-11-17
Applicant: 南京大学
Abstract: 本发明提供的向量处理器以及数据处理方法,在处理器通道内加入了脉动阵列加速单元,用于实现向量之间的计算。充分利用了原架构上的存储单元,增大了数据吞吐量,实现较多向量数据的之间的计算,使得脉动阵列加速器的加速效果得到充分利用,计算利用率得到大幅提高。脉动阵列加速器可以支持多精度及超低比特量化计算,提高向量计算的效率,同时向量处理器的并行性和可拓展性可以极大地提高数据计算密度,从而实现算力的有效提升。
-
-