面向DCU集群的大规模有限元网格并行分区的方法及装置

    公开(公告)号:CN113239591B

    公开(公告)日:2023-10-27

    申请号:CN202110541398.X

    申请日:2021-05-18

    Abstract: 本发明涉及高性能计算技术领域,特别是指一种面向DCU集群的大规模有限元网格并行分区的方法及装置,该方法包括:将求解区域离散为网格,通过带权对偶图描述离散所得的网格的分布情况,其中,所述带权对偶图中的顶点表示网格,所述带权对偶图中的边表示网格间的连接关系,通过子图划分任务的并行,可以极大提高递归谱二分法划分的速度,而且,在子图划分并行之上,还可以进行谱二分法计算热点的并行,进一步缩短了有限元网格划分的处理时间,解决了串行递归谱二分法存在着划分大规模网格时间需求过长的问题,使得解决问题的效率大大提高。

    一种自适应稀疏矩阵向量乘策略选择及优化方法

    公开(公告)号:CN114491401A

    公开(公告)日:2022-05-13

    申请号:CN202210066813.5

    申请日:2022-01-20

    Abstract: 本发明公开了一种自适应稀疏矩阵向量乘策略选择及优化方法,适用于GPU架构,该方法包括:对待处理矩阵按行进行分块,统计各矩阵子块的非零元素数,若各矩阵子块的非零元素数差别倍数高于第一预设阈值,则采用自适应的CSR‑Vector算法进行处理;统计待处理矩阵的行平均非零元素个数,若矩阵行平均非零元素个数低于第二预设阈值,则采用改进的CSR‑Stream算法进行求解;统计待处理矩阵的非零元素个数,若其非零元素个数大于第三预设阈值,则采用hola算法进行求解;若以上条件均不满足,则采用CSR‑Vector算法进行求解。本发明实现了针对不同应用问题的自适应高效SpMV求解。

    一种快中子反应堆全堆芯子通道并行任务划分方法及系统

    公开(公告)号:CN111008070B

    公开(公告)日:2023-05-12

    申请号:CN201911262033.2

    申请日:2019-12-10

    Abstract: 本发明提供一种快中子反应堆全堆芯子通道并行任务划分方法及系统,所述方法包括:将待划分的快中子反应堆全堆芯子通道按照预设数据结构进行存储;基于预设数据结构,对当前组件内的所有子通道进行遍历,将当前组件内的子通道划分至预设数量的求解域中,完成当前组件的并行任务划分;将当前组件的并行任务划分结果应用于快中子反应堆全堆芯中所有组件,以完成快中子反应堆全堆芯子通道并行任务划分。本发明方法基于特定的数据结构和划分算法实现了快堆全堆芯的并行任务划分,使得热工流体子通道模拟软件能够大规模并行求解快堆问题,对于提升快堆全堆芯子通道模拟效率有着重要意义。

    一种稀疏矩阵向量乘访存优化的计算方法

    公开(公告)号:CN114491402A

    公开(公告)日:2022-05-13

    申请号:CN202210066814.X

    申请日:2022-01-20

    Abstract: 本发明公开了一种稀疏矩阵向量乘访存优化的计算方法,适用于DCU和GPU架构,该方法包括:将原始稀疏矩阵按照固定行数划分为若干块,每块由一个线程块单独完成计算,并为每个线程块在LDS开辟固定大小的空间;计算每一线程块需要计算的轮次数;在一个轮次的计算中,每个线程块中所有线程完成若干次非零元素计算并将结果写入LDS;每个线程块中一个或多个线程对LDS的乘法结果进行求和并将结果保存至寄存器;当完成所有轮次计算后,将寄存器中的结果进行进一步计算,并将结果写回显存。本发明基于原始CSR格式,无需预处理,且能充分利用访存合并特性,实现了较高的访存带宽利用。

    一种基于块结构法的快堆堆芯组件的六面体网格并行生成方法

    公开(公告)号:CN119559357A

    公开(公告)日:2025-03-04

    申请号:CN202411615810.8

    申请日:2024-11-13

    Abstract: 本发明涉及有限元网格技术领域,具体公开一种基于块结构法的快堆堆芯组件的六面体网格并行生成方法,在绕丝同侧的区域进行德劳内三角剖分,求解拉普拉斯方程生成等值线,并根据等值线生成正交网格,得到绕丝同侧的三角形面网格模板;将燃料棒组件分为六段,每段再分为若干层,以第一段作为基础段,基于所述绕丝同侧的三角形面网格模板,在每一层中划分块网格,并在块网格中生成四边形面网格,将各层面网格一次旋转设定角度得到其他段的各层面网格,连接各层面网格形成六面体网格模型;对六面体网格模型进行扩展;对循环调用函数进行并行优化。本发明解决了快堆堆芯组件六面体网格无法正确生成以及网格划分效率低下的问题。

    面向DCU集群的异构并行亥姆霍兹算子构造方法

    公开(公告)号:CN119356862A

    公开(公告)日:2025-01-24

    申请号:CN202411402685.2

    申请日:2024-10-09

    Abstract: 本发明公开了面向DCU集群的异构并行亥姆霍兹算子构造方法,属于计算流体力学技术领域;本发明提出一种面向DCU集群的异构并行亥姆霍兹算子构造方法,主要包括分块矩阵乘访存优化和任务分解算法设计两部分内容,相较于现有设计,本发明不再对主存进行细粒度访问,而是充分利用DCU上的片上共享内存和寄存器,对矩阵进行分块并行预取,显著降低了访存开销;此外,本发明使任务在DCU上合理分配,充分利用DCU计算能力,加速效果随着插值阶数的增大加速比相应增大;最后,解决程序CPU与DCU间、多DCU间的负载均衡问题,提高了程序的可扩展性,使用多DCU可以进一步获得加速比的提升。

    一种快堆全堆芯高保真并行模拟的统一网格顶点索引方法

    公开(公告)号:CN118657077B

    公开(公告)日:2024-12-17

    申请号:CN202410686890.X

    申请日:2024-05-30

    Abstract: 本发明公开了一种快堆全堆芯高保真并行模拟的统一网格顶点索引方法,属于高性能计算与数值模拟领域;本发明首先进行常量的定义以及MPI初始化,然后由各个处理器并行地生成局部哈希表,得到局部顶点编号;接着通过MPI_Send()和MPI_Recv()函数,由0号处理器生成全局哈希表,处理冲突,最终得到全局顶点编号,进而建立索引。本发明通过哈希表实现对网格顶点的局部与全局编号,通过MPI实现各处理器顶点编号任务的并行,为各处理器提供一种创新的全局顶点编号方法,提高大规模并行效率,助力大规模高保真热工流体数值模拟软件的研发。

    一种快堆全堆芯高保真并行模拟的统一网格顶点索引方法

    公开(公告)号:CN118657077A

    公开(公告)日:2024-09-17

    申请号:CN202410686890.X

    申请日:2024-05-30

    Abstract: 本发明公开了一种快堆全堆芯高保真并行模拟的统一网格顶点索引方法,属于高性能计算与数值模拟领域;本发明首先进行常量的定义以及MPI初始化,然后由各个处理器并行地生成局部哈希表,得到局部顶点编号;接着通过MPI_Send()和MPI_Recv()函数,由0号处理器生成全局哈希表,处理冲突,最终得到全局顶点编号,进而建立索引。本发明通过哈希表实现对网格顶点的局部与全局编号,通过MPI实现各处理器顶点编号任务的并行,为各处理器提供一种创新的全局顶点编号方法,提高大规模并行效率,助力大规模高保真热工流体数值模拟软件的研发。

Patent Agency Ranking