-
公开(公告)号:CN113377534A
公开(公告)日:2021-09-10
申请号:CN202110636177.0
申请日:2021-06-08
Applicant: 东南大学
Abstract: 本发明公开了一种基于CSR格式的高性能稀疏矩阵向量乘法计算方法,该方法首先根据现有的方法进行空间局部性优化,循环效率优化与访存效率优化;根据现有硬件资源的配置与仿真情况,自适应的开辟合理数目的线程,优化加锁解锁方式使线程池更高效;针对cache missing问题与硬件条件完成适应性的亲和性设置。本发明基于传统的CSR格式的稀疏矩阵向量乘法,充分考虑硬件资源对计算性能的限制,以及算法对计算效率与访存效率的影响;在改进原有算法基础上,模型可以资源配置与任务数目,自适应的通过基于矩阵索引的线程池与亲和性设置完成仿真加速。