基于MPI+X的DSMC并行计算方法、设备及介质

    公开(公告)号:CN113791912A

    公开(公告)日:2021-12-14

    申请号:CN202111333599.7

    申请日:2021-11-11

    Abstract: 本发明公开了一种基于MPI+X的DSMC并行计算方法、设备及介质,其中方法包括以下步骤:根据计算的节点数目和节点内可用CPU核数对网格进行分区,将其划分为多个独立的分区文件;初始化MPI即粗粒度多进程,各进程载入网格数据;各进程对载入的所述网格数据分别进行相应的预处理;各进程分别启用多线程并行计算各自分区内的粒子运动;各进程分别对各自分区内的粒子索引进行排序编号;各进程分别对各自分区内的粒子进行碰撞计算;各进程分别对各自的子区域流场性质进行采样;迭代步数如果达到阈值,则进行相应的后处理并输出结果文件。本发明将粗粒度多进程与细粒度多线程有效结合,可以大大减少通信量和通信次数,有效提升并行效率。

    一种基于二维胖树网络的计算结点分配方法及装置

    公开(公告)号:CN113391919A

    公开(公告)日:2021-09-14

    申请号:CN202110450135.8

    申请日:2021-04-25

    Abstract: 本申请公开了一种基于二维胖树网络的计算结点分配方法及装置,该方法包括:确定预设二维胖树网络中的行数、总计算结点数以及总机框数,根据所述行数、所述总计算结点数以及所述总机框数计算将计算结点均匀分配到每一行的数目以及每一机框的数目;根据所述每一行的数目和所述每一机框的数目对所述二维胖树网络中的计算结点进行重新编号,其中,重新编号的二维胖树网络中同一机框中的计算结点编号连续,且同一行不同机框的计算结点编号不连续;确定待处理作业,根据所述待处理作业从所述重新编号的二维胖树网络中选择出位于同一机框的所述待处理作业所需的多个连续计算结点。本申请解决了现有技术中通信开销较大的技术问题。

    基于无同步SpTRSV算法的访存与并行效率优化方法

    公开(公告)号:CN118519787A

    公开(公告)日:2024-08-20

    申请号:CN202410985246.2

    申请日:2024-07-23

    Abstract: 本发明公开了一种基于无同步SpTRSV算法的访存与并行效率优化方法,属于高性能并行计算领域,包括:步骤一,根据稀疏矩阵非零元素将行划分为长行和短行;步骤二,将目标向量x的值均设置为最大值;步骤三,将写阶段所需的数据预取到寄存器中;步骤四,在读阶段,判断依赖情况并进行累加操作;步骤五,在写阶段,从寄存器读取数据,计算对应行x的值。本发明解决了目前无同步SpTRSV算法中线程级并行写阶段的线程分歧问题,以及线程级和线程束级粗粒度的选择策略,从而导致GPU利用率不高的问题。

    一种基于涡量和雷诺数映射关系的三维流场智能分类方法

    公开(公告)号:CN118171207A

    公开(公告)日:2024-06-11

    申请号:CN202410591155.0

    申请日:2024-05-13

    Abstract: 本发明公开了一种基于涡量和雷诺数映射关系的三维流场智能分类方法,其包括将三维流场中的流场属性集中的每个离散采样点定义为具有位置、时间和速度三个物理量,将三维涡量定义为速度的旋度;将三维涡量表征为二维涡量;推导出二维涡量与雷诺数的对应关系,得到三维流场分类标准;通过连续采样时间的二维涡量,计算得到二维涡量时间序列,并将其作为二维涡量智能分类模型的输入;将二维涡量时间序列作为二维涡量智能分类模型的训练样本并对其进行训练,得到训练好的二维涡量智能分类模型;将新的二维涡量时间序列输入训练好的二维涡量智能分类模型中,得到三维流场所属分类。本发明提高了三维流场的分类效率。

Patent Agency Ranking