-
公开(公告)号:CN110472187B
公开(公告)日:2021-05-04
申请号:CN201910721093.X
申请日:2019-08-06
Applicant: 中国原子能科学研究院
Abstract: 本发明涉及一种三维中子输运特征线法的负载均衡并行方法,该方法根据几何的对称性,计算出需要考虑的角度数量,并计算每个角度下周期性轨迹或反射性轨迹的数量和长度,根据周期性或反射性轨迹的长度、进程数量以及轨迹的数量,计算出每个进程的负载,对各进程分别进行射线追踪,并根据几何网格信息、材料数据、射线追踪完成后的线段信息,迭代求解特征方程。本发明将周期性轨迹和反射性轨迹完整地分配给线程,可以高效地分配并行任务,保证负载平衡,消除进程间的点到点通信。
-
公开(公告)号:CN110543711A
公开(公告)日:2019-12-06
申请号:CN201910788607.3
申请日:2019-08-26
Applicant: 中国原子能科学研究院
IPC: G06F17/50
Abstract: 本发明涉及一种数值堆热工水力子通道模拟的并行实现与优化方法,该方法使用CPU+GPU混合异构实现热工水力子通道模拟计算,将求解固体导热部分中求解热传递系数部分移植到GPU上进行求解,并在遍历子通道和遍历轴向节点时通过OpenMP对热传递系数求解过程进行进一步的并行;在动量方程的建立和求解部分将计算轴向节点的横向速度和轴向速度移植到GPU上进行求解,并将GPU函数中求解横向速度和轴向速度的函数分解为两个函数,加入OpenMP两个线程同时求解一个轴向层的轴向速度和横向速度。本发明可以提高热工水力子通道模拟软件的并行效率,并提升软件对于CPU/GPU架构计算机硬件的利用率。
-
公开(公告)号:CN110532093A
公开(公告)日:2019-12-03
申请号:CN201910781296.8
申请日:2019-08-23
Applicant: 中国原子能科学研究院
Abstract: 本发明涉及一种数值核反应堆多几何形状全堆芯子通道并行任务划分方法,该方法对堆芯中的组件、燃料棒以及子通道建立全局索引,给定唯一编号,并建立组件-燃料棒-子通道之间的对应关系,然后子通道与子通道之间的连接关系映射成为一个无向图,以子通道为基本对象,将全局的子通道划分到各个计算单元上,划分到每个计算单元上的子通道形成划分域,并在空间上相邻的划分域之间建立ghost子通道区域。本发明将子通道并行任务划分问题转化为一个图划分问题,通过自适应的区域划分算法,可以使得并行热工水力模拟软件使用任意个数的MPI进程运行,并能够保证负载均衡与通信最小化。
-
公开(公告)号:CN110472187A
公开(公告)日:2019-11-19
申请号:CN201910721093.X
申请日:2019-08-06
Applicant: 中国原子能科学研究院
Abstract: 本发明涉及一种三维中子输运特征线法的负载均衡并行方法,该方法根据几何的对称性,计算出需要考虑的角度数量,并计算每个角度下周期性轨迹或反射性轨迹的数量和长度,根据周期性或反射性轨迹的长度、进程数量以及轨迹的数量,计算出每个进程的负载,对各进程分别进行射线追踪,并根据几何网格信息、材料数据、射线追踪完成后的线段信息,迭代求解特征方程。本发明将周期性轨迹和反射性轨迹完整地分配给线程,可以高效地分配并行任务,保证负载平衡,消除进程间的点到点通信。
-
公开(公告)号:CN111666689A
公开(公告)日:2020-09-15
申请号:CN202010519286.X
申请日:2020-06-09
Applicant: 中国原子能科学研究院
IPC: G06F30/20
Abstract: 一种特征线追踪方法、堆芯中子物理计算方法及装置以及计算机可读储存介质,所述特征线追踪方法包括:按层级由上到下依次判断每个所述层级中符合第一预设条件的所述子模型与所述特征线的交集是否符合第二预设条件;获得最下层级符合所述第一预设条件的所述子模型与所述特征线的符合所述第二预设条件的交集,根据获得的所述交集得到所述特征线与所述堆芯的所有材料的分段对应关系。这种特征线追踪方法减小了计算量,提高了计算效率。
-
公开(公告)号:CN119559357A
公开(公告)日:2025-03-04
申请号:CN202411615810.8
申请日:2024-11-13
Applicant: 北京科技大学
Abstract: 本发明涉及有限元网格技术领域,具体公开一种基于块结构法的快堆堆芯组件的六面体网格并行生成方法,在绕丝同侧的区域进行德劳内三角剖分,求解拉普拉斯方程生成等值线,并根据等值线生成正交网格,得到绕丝同侧的三角形面网格模板;将燃料棒组件分为六段,每段再分为若干层,以第一段作为基础段,基于所述绕丝同侧的三角形面网格模板,在每一层中划分块网格,并在块网格中生成四边形面网格,将各层面网格一次旋转设定角度得到其他段的各层面网格,连接各层面网格形成六面体网格模型;对六面体网格模型进行扩展;对循环调用函数进行并行优化。本发明解决了快堆堆芯组件六面体网格无法正确生成以及网格划分效率低下的问题。
-
公开(公告)号:CN119356862A
公开(公告)日:2025-01-24
申请号:CN202411402685.2
申请日:2024-10-09
Applicant: 北京科技大学
Abstract: 本发明公开了面向DCU集群的异构并行亥姆霍兹算子构造方法,属于计算流体力学技术领域;本发明提出一种面向DCU集群的异构并行亥姆霍兹算子构造方法,主要包括分块矩阵乘访存优化和任务分解算法设计两部分内容,相较于现有设计,本发明不再对主存进行细粒度访问,而是充分利用DCU上的片上共享内存和寄存器,对矩阵进行分块并行预取,显著降低了访存开销;此外,本发明使任务在DCU上合理分配,充分利用DCU计算能力,加速效果随着插值阶数的增大加速比相应增大;最后,解决程序CPU与DCU间、多DCU间的负载均衡问题,提高了程序的可扩展性,使用多DCU可以进一步获得加速比的提升。
-
公开(公告)号:CN118657077B
公开(公告)日:2024-12-17
申请号:CN202410686890.X
申请日:2024-05-30
Applicant: 北京科技大学
IPC: G06F30/28 , G06F113/08 , G06F111/10
Abstract: 本发明公开了一种快堆全堆芯高保真并行模拟的统一网格顶点索引方法,属于高性能计算与数值模拟领域;本发明首先进行常量的定义以及MPI初始化,然后由各个处理器并行地生成局部哈希表,得到局部顶点编号;接着通过MPI_Send()和MPI_Recv()函数,由0号处理器生成全局哈希表,处理冲突,最终得到全局顶点编号,进而建立索引。本发明通过哈希表实现对网格顶点的局部与全局编号,通过MPI实现各处理器顶点编号任务的并行,为各处理器提供一种创新的全局顶点编号方法,提高大规模并行效率,助力大规模高保真热工流体数值模拟软件的研发。
-
公开(公告)号:CN118657077A
公开(公告)日:2024-09-17
申请号:CN202410686890.X
申请日:2024-05-30
Applicant: 北京科技大学
IPC: G06F30/28 , G06F113/08 , G06F111/10
Abstract: 本发明公开了一种快堆全堆芯高保真并行模拟的统一网格顶点索引方法,属于高性能计算与数值模拟领域;本发明首先进行常量的定义以及MPI初始化,然后由各个处理器并行地生成局部哈希表,得到局部顶点编号;接着通过MPI_Send()和MPI_Recv()函数,由0号处理器生成全局哈希表,处理冲突,最终得到全局顶点编号,进而建立索引。本发明通过哈希表实现对网格顶点的局部与全局编号,通过MPI实现各处理器顶点编号任务的并行,为各处理器提供一种创新的全局顶点编号方法,提高大规模并行效率,助力大规模高保真热工流体数值模拟软件的研发。
-
公开(公告)号:CN116610424B
公开(公告)日:2024-04-26
申请号:CN202310209027.0
申请日:2023-03-06
Applicant: 北京科技大学
Abstract: 本发明公开了一种基于GPU合并访存的模板计算二维线程块选择方法,属于高性能计算与算法技术领域;本发明包括如下步骤:S1、给定一个模板计算在二维平面内的半径,确定模板计算过程中一个二维线程块所需的数据形状;S2、基于合并访存技术,计算二维线程块的数据读取次数;给定浮点数精度,获取计算环境的相关信息,确定线程块的筛选条件;S3、依据S2中所述的筛选条件筛选出一个或多个合并访存技术需要的线程块,称为候选线程块;S4、给定开销指标并对其进行排序,依据开销指标从候选线程块中选出理论上最好的线程块,用于实际的GPU计算。本发明综合考虑了合并访存、bank冲突、负载平衡等影响因素,能够选择出计算性能较高的线程块。
-
-
-
-
-
-
-
-
-