-
公开(公告)号:CN118133908A
公开(公告)日:2024-06-04
申请号:CN202410133248.9
申请日:2024-01-31
Applicant: 南京大学
Abstract: 本申请提供一种基于Transformer的加速系统及方法,所述系统包括硬件加速器和神经网络模块,神经网络模块中运行有神经网络模型,硬件加速器包括存储器、第一加速模块和第二加速模块,第一加速模块包括多个可重构单元,第二加速模块包括多个处理单元,第一加速模块通过可重构单元对键值对数据累加计算,得到注意力数据,第二加速模块通过处理单元,根据权重数据和特征图数据计算多层感知机数据,神经网络模块根据注意力数据和多层感知机数据输出分类结果。本申请通过加速模块对神经网络模型中的计算流程进行加速,实现对神经网络模型的整体加速,提高神经网络模型处理数据的效率。