一种众核平台上面向规则网格问题的结构化着色方法

    公开(公告)号:CN110942504B

    公开(公告)日:2021-07-27

    申请号:CN201911047165.3

    申请日:2019-10-30

    Abstract: 本发明公开一种众核平台上面向规则网格问题的结构化着色方法,包括如下步骤:步骤一、依赖特性分析:对按照stencil模板格式生成的计算问题中的各计算任务之间的依赖特性进行分析,包括依赖传递特性分析和强弱依赖方向分析;步骤二、参数搜索:根据依赖特性分析结果,使用四种参数搜索模式进行最优的着色规则参数搜索;步骤三、计算任务划分:根据最优的着色规则参数为每个计算任务着色,并将相同颜色的计算任务分为一组,不同颜色的计算任务分为不同组,总的颜色数即为计算任务的总的划分组数,完成计算任务的划分;本发明保证了在相同颜色数的限制下,保留更多的核心依赖关系,从而有效减少了计算的整体迭代次数,并提高了着色质量。

    一种适合复杂异构系统的HPL矩阵更新优化方法

    公开(公告)号:CN111913748B

    公开(公告)日:2022-05-24

    申请号:CN202010669721.7

    申请日:2020-07-13

    Abstract: 本发明公开了一种适合复杂异构系统的HPL矩阵更新优化方法,其特征在于,对HPL矩阵更新的行交换进行优化:在执行HPL的第一分段行交换完成、上一次循环矩阵更新和当前进程接收到下一次循环的行交换信息之后,执行第一分段的下一次循环的行交换。对Long行交换通信方法优化,将spread过程接收缓冲与roll过程发送缓冲分离,当前行进程执行roll过程前,将数据拷贝到roll发送缓冲区;在roll过程执行网络传输的同时,将spread所需的数据传输到MPI发送缓冲区;roll执行完成MPI网络通信后,开启执行spread过程,同时把roll接收的数据异步传输到GPU。本发明能够充分发挥GPU的计算能力。

    一种适合复杂异构系统的HPL的Panel分解优化方法和装置

    公开(公告)号:CN111913747B

    公开(公告)日:2022-05-24

    申请号:CN202010636408.3

    申请日:2020-07-03

    Abstract: 本发明公开一种适合复杂异构系统的HPL的Panel分解优化方法和装置。该优化方法通过分析HPL中Panel分解基础代码,得出影响系统性能的瓶颈,为了进一步提高系统效率,采用基本参数调优、GPU加速Panel分解DGEMM以及Panel广播的优化加速Panel分解,其中Panel广播的优化包括避免数据封装和Panel广播流水两方面的优化。本发明将Panel广播流水与GPU加速Panel分解DGEMM协同使用,充分利用系统的CPU、GPU、PCIe和网络接口资源,提高了整个CPU+GPU复杂异构系统HPL测试程序的效率。

    一种适合复杂异构系统的HPL矩阵更新优化方法

    公开(公告)号:CN111913748A

    公开(公告)日:2020-11-10

    申请号:CN202010669721.7

    申请日:2020-07-13

    Abstract: 本发明公开了一种适合复杂异构系统的HPL矩阵更新优化方法,其特征在于,对HPL矩阵更新的行交换进行优化:在执行HPL的第一分段行交换完成、上一次循环矩阵更新和当前进程接收到下一次循环的行交换信息之后,执行第一分段的下一次循环的行交换。对Long行交换通信方法优化,将spread过程接收缓冲与roll过程发送缓冲分离,当前行进程执行roll过程前,将数据拷贝到roll发送缓冲区;在roll过程执行网络传输的同时,将spread所需的数据传输到MPI发送缓冲区;roll执行完成MPI网络通信后,开启执行spread过程,同时把roll接收的数据异步传输到GPU。本发明能够充分发挥GPU的计算能力。

    一种适合复杂异构系统的HPL的Panel分解优化方法和装置

    公开(公告)号:CN111913747A

    公开(公告)日:2020-11-10

    申请号:CN202010636408.3

    申请日:2020-07-03

    Abstract: 本发明公开一种适合复杂异构系统的HPL的Panel分解优化方法和装置。该优化方法通过分析HPL中Panel分解基础代码,得出影响系统性能的瓶颈,为了进一步提高系统效率,采用基本参数调优、GPU加速Panel分解DGEMM以及Panel广播的优化加速Panel分解,其中Panel广播的优化包括避免数据封装和Panel广播流水两方面的优化。本发明将Panel广播流水与GPU加速Panel分解DGEMM协同使用,充分利用系统的CPU、GPU、PCIe和网络接口资源,提高了整个CPU+GPU复杂异构系统HPL测试程序的效率。

    一种众核平台上面向规则网格问题的结构化着色方法

    公开(公告)号:CN110942504A

    公开(公告)日:2020-03-31

    申请号:CN201911047165.3

    申请日:2019-10-30

    Abstract: 本发明公开一种众核平台上面向规则网格问题的结构化着色方法,包括如下步骤:步骤一、依赖特性分析:对按照stencil模板格式生成的计算问题中的各计算任务之间的依赖特性进行分析,包括依赖传递特性分析和强弱依赖方向分析;步骤二、参数搜索:根据依赖特性分析结果,使用四种参数搜索模式进行最优的着色规则参数搜索;步骤三、计算任务划分:根据最优的着色规则参数为每个计算任务着色,并将相同颜色的计算任务分为一组,不同颜色的计算任务分为不同组,总的颜色数即为计算任务的总的划分组数,完成计算任务的划分;本发明保证了在相同颜色数的限制下,保留更多的核心依赖关系,从而有效减少了计算的整体迭代次数,并提高了着色质量。

Patent Agency Ranking