一种面向异构计算系统的自动调优负载均衡方法

    公开(公告)号:CN118034909A

    公开(公告)日:2024-05-14

    申请号:CN202311836646.9

    申请日:2023-12-28

    Inventor: 王玉柱 李菲

    Abstract: 本发明公开了一种面向异构计算系统的自动调优负载均衡方法,包括如下步骤:使用MPI+OpenMP+CUDA/HIP三级混合编程模型启动异构计算系统中的CPU和GPU资源;基于整体运算时间,利用假位置搜索算法得出CPU和GPU计算工作量的最佳计算负载比例;根据最佳计算负载比例动态划分CPU和GPU的计算任务。本发明通过在MPI+OpenMP+HIP三级混合编程模型CPU端使用三级并行域的方式在充分利用计算资源的同时缓解了GPU的计算压力;同时,基于整体运算时间的自动调优负载均衡方法得出CPU和GPU计算工作量的最佳计算负载比例,实现了合理划分不同设备的计算任务达到负载均衡的目的。

    一种基于异构计算系统的混合精度计算误差补偿方法

    公开(公告)号:CN116630137A

    公开(公告)日:2023-08-22

    申请号:CN202310663299.8

    申请日:2023-06-06

    Inventor: 王玉柱 李菲

    Abstract: 本发明公开了一种基于异构计算系统的混合精度计算误差补偿方法,主要通过负载均衡算法对运行于异构系统的气候模式混合精度算法进行误差补偿,在加速算法计算的同时提升混合精度算法的精度。该方法包括以下步骤:分别使用OpenMP和HIP多线程计算的方式对算法在CPU端和GPU端进行并行计算;使用单双精度混合计算的方式进一步加速GPU并行算法;对计算任务进行划分,根据CPU和GPU的计算能力平衡计算负载;CPU端使用双精度,GPU端使用混合精度,达到利用双精度的高准确度补偿混合精度计算误差的目的。本发明的有益效果:能够大幅提升气候模式的计算效率,同时为降低混合精度计算的误差问题提供了一种有效的解决方案。

    一种基于GPU的短波辐射传输模式三维加速方法

    公开(公告)号:CN114116208A

    公开(公告)日:2022-03-01

    申请号:CN202111341299.3

    申请日:2021-11-12

    Inventor: 王玉柱 李菲

    Abstract: 本发明公开了一种基于GPU的短波辐射传输模式三维加速方法,通过对大气短波辐射传输模式RRTMG_SW进行基于GPU的三维并行计算以及性能优化,提升了RRTMG_SW的计算效率。该方法包括以下步骤:①三维并行计算:在CPU端为短波辐射过程定义、初始化数据;定义三维向量dim3类型的变量;为GPU端分配合适的内存空间来存储计算数据以及最终结果;将CPU内存中参与计算的数据复制到GPU的全局内存中;进行主机和设备端的数据传输并启动kernel函数开始三维并行计算;将GPU端的计算结果复制回CPU端。②算法性能优化:使用GPU寄存器降低计算过程中的全局内存访问时间;使用CUDA流覆盖数据传输与kernel计算过程。本发明有益效果:大大提升了RRTMG_SW的计算效率,使其更加适合使用GPU进行并行计算。

    一种基于多GPU的浅积云对流参数化方案异构计算方法

    公开(公告)号:CN115756605A

    公开(公告)日:2023-03-07

    申请号:CN202211390967.6

    申请日:2022-11-07

    Inventor: 王玉柱 李菲

    Abstract: 本发明公开了一种基于多GPU的浅积云对流参数化方案异构计算方法,主要通过多GPU卡对大气环流模式中浅积云对流参数化方案UWshcu进行加速计算,以此来提高大气环流模式中浅积云对流物理过程的计算效率。该方法包括以下步骤:在主机端对浅积云对流物理过程所需数据进行定义和初始化;通过MPI将数据分发到主机端各个节点上进行计算;使用CUDA API启动每个节点上的GPU;启动核函数,使核函数在GPU上进行线程级的并行计算;将计算结果传回CPU并通过MPI收集计算结果。本发明的有益效果:首次使用CPU+GPU异构计算的方式对浅对流参数化方案UWshcu进行加速计算,大大提升了大气环流模式中浅积云对流物理过程的计算效率。

Patent Agency Ranking