-
公开(公告)号:CN116662726A
公开(公告)日:2023-08-29
申请号:CN202310645045.3
申请日:2023-06-02
Applicant: 北京科技大学
Abstract: 本发明公开了面向GPU和DCU架构的SpGEMM算法策略选择及优化方法,属于高性能计算技术领域;本发明在大量试验的基础上,对SpGEMM算法进行计算和访存优化;结合稀疏矩阵特征和GPU、DCU架构的特点,实现了SpGEMM自适应策略选择算法,并自适应的为不同算法设置相应求解参数,以达到更高的SpGEMM求解效率。
-
公开(公告)号:CN116150553B
公开(公告)日:2023-07-21
申请号:CN202310215144.8
申请日:2023-03-01
Applicant: 北京科技大学
Abstract: 本发明公开了一种面向CPU+DCU异构混合架构的稀疏化AMG优化方法,属于高性能计算与算法技术领域;本发明提出一种面向CPU+DCU异构混合架构的稀疏化AMG优化方法,在形成粗网格层次结构后,通过并行方式去除矩阵中的弱连接或不重要的元素(非零元素)来对层次矩阵进行稀疏化优化,可以降低后续设置阶段并行的通信成本。本发明还对粗网格矩阵生成过程中涉及到的大量三个矩阵乘运算针对超算CPU+DCU异构混合架构进行并行优化,进一步提升了AMG方法的预处理效率。
-
公开(公告)号:CN116150553A
公开(公告)日:2023-05-23
申请号:CN202310215144.8
申请日:2023-03-01
Applicant: 北京科技大学
Abstract: 本发明公开了一种面向CPU+DCU异构混合架构的稀疏化AMG优化方法,属于高性能计算与算法技术领域;本发明提出一种面向CPU+DCU异构混合架构的稀疏化AMG优化方法,在形成粗网格层次结构后,通过并行方式去除矩阵中的弱连接或不重要的元素(非零元素)来对层次矩阵进行稀疏化优化,可以降低后续设置阶段并行的通信成本。本发明还对粗网格矩阵生成过程中涉及到的大量三个矩阵乘运算针对超算CPU+DCU异构混合架构进行并行优化,进一步提升了AMG方法的预处理效率。
-
-