一种基于钉固内存的短波辐射模式数据传输性能优化方法

    公开(公告)号:CN113315803A

    公开(公告)日:2021-08-27

    申请号:CN202110308249.9

    申请日:2021-03-23

    Inventor: 王玉柱 王珍珍

    Abstract: 本发明公开了一种基于钉固内存的短波辐射模式数据传输性能优化方法,主要通过使用钉固内存技术对短波辐射模式RRTMG_SW在CPU与GPU之间数据传输进行性能优化,以此来提高短波辐射通量以及冷却/加热速率在GPU上的计算效率。该方法包括以下步骤:首先,将代码中的数组改写为指针形式;然后,使用cudaMallocHost函数分配页锁定内存;最后,利用cudaFreeHost函数将其分配的内存释放。本发明有益效果:使用钉固内存技术后,主机端(CPU)与设备端(GPU)之间拥有更大的传输带宽,最高可以达到数据传输3.63倍的加速效果,缩短了数据传输时间,提高了短波辐射模式的计算效率。

    一种面向异构计算系统的自动调优负载均衡方法

    公开(公告)号:CN118034909A

    公开(公告)日:2024-05-14

    申请号:CN202311836646.9

    申请日:2023-12-28

    Inventor: 王玉柱 李菲

    Abstract: 本发明公开了一种面向异构计算系统的自动调优负载均衡方法,包括如下步骤:使用MPI+OpenMP+CUDA/HIP三级混合编程模型启动异构计算系统中的CPU和GPU资源;基于整体运算时间,利用假位置搜索算法得出CPU和GPU计算工作量的最佳计算负载比例;根据最佳计算负载比例动态划分CPU和GPU的计算任务。本发明通过在MPI+OpenMP+HIP三级混合编程模型CPU端使用三级并行域的方式在充分利用计算资源的同时缓解了GPU的计算压力;同时,基于整体运算时间的自动调优负载均衡方法得出CPU和GPU计算工作量的最佳计算负载比例,实现了合理划分不同设备的计算任务达到负载均衡的目的。

    一种基于CUDA Fortran的短波辐射模式加速方法

    公开(公告)号:CN112926202A

    公开(公告)日:2021-06-08

    申请号:CN202110201898.9

    申请日:2021-02-23

    Abstract: 本发明公开了一种基于CUDA Fortran的短波辐射模式加速方法,主要通过CUDA Fortran对地球系统模式中短波辐射模式RRTMG_SW进行加速计算,以此来提高短波辐射通量以及冷却/加热速率的计算效率。该方法包括以下步骤:在CPU端进行短波辐射过程所需数据的定义、初始化;GPU分配合适的内存空间来存储计算参数以及最终结果;将CPU内存中的计算参数复制到GPU的全局内存中;启动GPU线程,调用kernel函数进行并行计算;将GPU内存中的最终计算结果传递回CPU内存。本发明有益效果:大幅缩短短波辐射模式计算时间,提高了地球系统模式的计算效率。

    一种基于CUDA C的短波辐射模式加速方法

    公开(公告)号:CN112906224A

    公开(公告)日:2021-06-04

    申请号:CN202110201042.1

    申请日:2021-02-23

    Inventor: 王玉柱 王珍珍

    Abstract: 本发明公开了一种基于CUDA C的短波辐射模式加速方法,主要通过CUDA C对地球系统模式中短波辐射模式RRTMG_SW进行加速计算,以此来提高短波辐射通量以及冷却/加热速率的计算效率。该方法包括以下步骤:在CPU端进行短波辐射过程所需数据的定义、初始化;GPU分配合适的内存空间来存储计算参数以及最终结果;将CPU内存中的计算参数复制到GPU的全局内存中;启动GPU线程,调用kernel函数进行并行计算;将GPU内存中的最终计算结果传递回CPU内存。本发明有益效果:大幅缩短短波辐射模式计算时间,提高了地球系统模式的计算效率。

    一种基于深度学习的遥感图像云识别方法

    公开(公告)号:CN109255294A

    公开(公告)日:2019-01-22

    申请号:CN201810872933.8

    申请日:2018-08-02

    Inventor: 王玉柱 陆君宇

    Abstract: 本发明公开了一种基于深度学习的遥感图像云识别方法,该方法包括:遥感云图像的自动获取,将遥感图像制作成训练集并扩大现有训练集,以及训练集中标签的制作;构造基于SegNet神经网络结构的、具有多尺度卷积核的、高度对称的,并且最后使用反卷积层对特征图进行还原的深度卷积神经网络;在网络训练时防止过拟合、欠拟合和梯度消失问题,采用分段训练的方法;在训练完成后,利用所得到权值文件进行遥感图像的特征提取,并将其在像素级别上进行云检测。本发明的遥感图像云识别深度卷积神经网络利用多尺度卷积和高度对称性提高了检索的准确性。

Patent Agency Ranking