-
公开(公告)号:CN118797227A
公开(公告)日:2024-10-18
申请号:CN202410871937.X
申请日:2024-07-01
Applicant: 之江实验室
Abstract: 本发明涉及一种面向稀疏矩阵乘法的矩阵划分方法和硬件加速器,方法包括通过自适应的矩阵划分调度策略对矩阵进行划分,对待乘矩阵A与B进行基于负载感知的重排序,在重排序后的矩阵上进行基于滑动窗口的自适应划分,对矩阵划分方案进行敏捷评估,得出最优矩阵划分方案;通过面向稀疏矩阵乘法的通用硬件加速器对划分得到数据进行运算,通过缓存调度设计预取并调度矩阵划分块数据,通过高效写回合并设计将计算数据高效合并同时快速写回。与现有技术相比,本发明的矩阵划分方法能在很大程度上降低随机访存占比,提高计算流水线吞吐量,加快矩阵相乘速度;硬件加速器具有高灵活性和高效率,优化了性能表现。