一种适合复杂异构系统的HPL的Panel分解优化方法和装置

    公开(公告)号:CN111913747A

    公开(公告)日:2020-11-10

    申请号:CN202010636408.3

    申请日:2020-07-03

    Abstract: 本发明公开一种适合复杂异构系统的HPL的Panel分解优化方法和装置。该优化方法通过分析HPL中Panel分解基础代码,得出影响系统性能的瓶颈,为了进一步提高系统效率,采用基本参数调优、GPU加速Panel分解DGEMM以及Panel广播的优化加速Panel分解,其中Panel广播的优化包括避免数据封装和Panel广播流水两方面的优化。本发明将Panel广播流水与GPU加速Panel分解DGEMM协同使用,充分利用系统的CPU、GPU、PCIe和网络接口资源,提高了整个CPU+GPU复杂异构系统HPL测试程序的效率。

    一种适合复杂异构系统的HPL的Panel分解优化方法和装置

    公开(公告)号:CN111913747B

    公开(公告)日:2022-05-24

    申请号:CN202010636408.3

    申请日:2020-07-03

    Abstract: 本发明公开一种适合复杂异构系统的HPL的Panel分解优化方法和装置。该优化方法通过分析HPL中Panel分解基础代码,得出影响系统性能的瓶颈,为了进一步提高系统效率,采用基本参数调优、GPU加速Panel分解DGEMM以及Panel广播的优化加速Panel分解,其中Panel广播的优化包括避免数据封装和Panel广播流水两方面的优化。本发明将Panel广播流水与GPU加速Panel分解DGEMM协同使用,充分利用系统的CPU、GPU、PCIe和网络接口资源,提高了整个CPU+GPU复杂异构系统HPL测试程序的效率。

Patent Agency Ranking