-
公开(公告)号:CN117010460A
公开(公告)日:2023-11-07
申请号:CN202310972001.1
申请日:2023-08-03
Applicant: 南京大学
Abstract: 本发明提供了一种Swin‑Transformer推理硬件加速器,包括外部存储、静态随机存取存储器SRAM和寄存器Reg构成的三层存储层次结构、两个量化单元、一个外积矩阵乘法阵列和三个非线性计算单元;本发明借助Swin Transformer独有的计算特性设计了应用在端侧的专用硬件加速架构,并在FPGA平台上进行了验证,该加速器的能效比NVIDIA RTX 2080Ti GPU提高了15.14倍,比现有的Transformer加速器提高了2.02到3.11倍。