-
公开(公告)号:CN119559357A
公开(公告)日:2025-03-04
申请号:CN202411615810.8
申请日:2024-11-13
Applicant: 北京科技大学
Abstract: 本发明涉及有限元网格技术领域,具体公开一种基于块结构法的快堆堆芯组件的六面体网格并行生成方法,在绕丝同侧的区域进行德劳内三角剖分,求解拉普拉斯方程生成等值线,并根据等值线生成正交网格,得到绕丝同侧的三角形面网格模板;将燃料棒组件分为六段,每段再分为若干层,以第一段作为基础段,基于所述绕丝同侧的三角形面网格模板,在每一层中划分块网格,并在块网格中生成四边形面网格,将各层面网格一次旋转设定角度得到其他段的各层面网格,连接各层面网格形成六面体网格模型;对六面体网格模型进行扩展;对循环调用函数进行并行优化。本发明解决了快堆堆芯组件六面体网格无法正确生成以及网格划分效率低下的问题。
-
公开(公告)号:CN119356862A
公开(公告)日:2025-01-24
申请号:CN202411402685.2
申请日:2024-10-09
Applicant: 北京科技大学
Abstract: 本发明公开了面向DCU集群的异构并行亥姆霍兹算子构造方法,属于计算流体力学技术领域;本发明提出一种面向DCU集群的异构并行亥姆霍兹算子构造方法,主要包括分块矩阵乘访存优化和任务分解算法设计两部分内容,相较于现有设计,本发明不再对主存进行细粒度访问,而是充分利用DCU上的片上共享内存和寄存器,对矩阵进行分块并行预取,显著降低了访存开销;此外,本发明使任务在DCU上合理分配,充分利用DCU计算能力,加速效果随着插值阶数的增大加速比相应增大;最后,解决程序CPU与DCU间、多DCU间的负载均衡问题,提高了程序的可扩展性,使用多DCU可以进一步获得加速比的提升。
-
公开(公告)号:CN118657077B
公开(公告)日:2024-12-17
申请号:CN202410686890.X
申请日:2024-05-30
Applicant: 北京科技大学
IPC: G06F30/28 , G06F113/08 , G06F111/10
Abstract: 本发明公开了一种快堆全堆芯高保真并行模拟的统一网格顶点索引方法,属于高性能计算与数值模拟领域;本发明首先进行常量的定义以及MPI初始化,然后由各个处理器并行地生成局部哈希表,得到局部顶点编号;接着通过MPI_Send()和MPI_Recv()函数,由0号处理器生成全局哈希表,处理冲突,最终得到全局顶点编号,进而建立索引。本发明通过哈希表实现对网格顶点的局部与全局编号,通过MPI实现各处理器顶点编号任务的并行,为各处理器提供一种创新的全局顶点编号方法,提高大规模并行效率,助力大规模高保真热工流体数值模拟软件的研发。
-
公开(公告)号:CN118657077A
公开(公告)日:2024-09-17
申请号:CN202410686890.X
申请日:2024-05-30
Applicant: 北京科技大学
IPC: G06F30/28 , G06F113/08 , G06F111/10
Abstract: 本发明公开了一种快堆全堆芯高保真并行模拟的统一网格顶点索引方法,属于高性能计算与数值模拟领域;本发明首先进行常量的定义以及MPI初始化,然后由各个处理器并行地生成局部哈希表,得到局部顶点编号;接着通过MPI_Send()和MPI_Recv()函数,由0号处理器生成全局哈希表,处理冲突,最终得到全局顶点编号,进而建立索引。本发明通过哈希表实现对网格顶点的局部与全局编号,通过MPI实现各处理器顶点编号任务的并行,为各处理器提供一种创新的全局顶点编号方法,提高大规模并行效率,助力大规模高保真热工流体数值模拟软件的研发。
-
公开(公告)号:CN116610424B
公开(公告)日:2024-04-26
申请号:CN202310209027.0
申请日:2023-03-06
Applicant: 北京科技大学
Abstract: 本发明公开了一种基于GPU合并访存的模板计算二维线程块选择方法,属于高性能计算与算法技术领域;本发明包括如下步骤:S1、给定一个模板计算在二维平面内的半径,确定模板计算过程中一个二维线程块所需的数据形状;S2、基于合并访存技术,计算二维线程块的数据读取次数;给定浮点数精度,获取计算环境的相关信息,确定线程块的筛选条件;S3、依据S2中所述的筛选条件筛选出一个或多个合并访存技术需要的线程块,称为候选线程块;S4、给定开销指标并对其进行排序,依据开销指标从候选线程块中选出理论上最好的线程块,用于实际的GPU计算。本发明综合考虑了合并访存、bank冲突、负载平衡等影响因素,能够选择出计算性能较高的线程块。
-
公开(公告)号:CN111696197B
公开(公告)日:2023-10-27
申请号:CN202010461303.9
申请日:2020-05-27
Applicant: 北京科技大学
Abstract: 本发明提供一种快堆六角形堆芯中子输运计算的射线生成与追踪方法,能够在提高并行计算效率的同时能够大幅度减少同等堆芯几何下对内存的需求。所述方法包括:构建快堆堆芯几何模型,所述几何模型为六角形,根据离散的方位角、平面射线间距在构建好的几何模型上生成2D轨迹,并根据边界条件对生成的2D轨迹进行修正;其中,轨迹即射线;根据修正后的2D轨迹,形成2D轨迹链,确定每条轨迹链的长度和数目,在l‑z平面上生成3D轨迹;将l‑z平面上生成的3D轨迹映射到真实三维几何中,生成真实的3D轨迹,对真实的3D轨迹进行追踪。本发明涉及中子物理与高性能计算的交叉技术领域。
-
公开(公告)号:CN111695244B
公开(公告)日:2023-06-27
申请号:CN202010429420.7
申请日:2020-05-20
Applicant: 北京科技大学
IPC: G06F30/20
Abstract: 本发明提供一种适用于多元SRSCD模拟的材料辐照缺陷存储方法,能够实现缺陷和反应的高效存储,以及快速查找、更新、插入、删除操作。所述方法包括:根据SRSCD模拟体系初始状态下的缺陷及缺陷可参与的反应,创建基于链表的Defect‑Reaction List;从缺陷‑反应列表中随机选择一个反应;针对选择的反应,遍历每一个反应物,查找缺陷‑反应列表中类型与反应物类型一样的缺陷,根据查找到的缺陷数量执行相应的操作;其中,所述操作包括:更新、插入、删除;针对选择的反应,遍历每一个产物,查找缺陷‑反应列表中是否存在类型与产物类型一样的缺陷,根据查找结果执行相应的操作,本发明涉及面向核材料辐照损伤模拟领域和高性能计算领域。
-
公开(公告)号:CN116167272A
公开(公告)日:2023-05-26
申请号:CN202310147863.0
申请日:2023-02-21
Applicant: 北京科技大学
IPC: G06F30/25 , G06F119/14
Abstract: 本发明公开一种原子尺度MD‑KMC并行模拟统一建模方法及系统,所述方法包括:建立原子尺度统一架构;基于所述原子尺度统一架构的分子动力学模拟;基于所述原子尺度统一架构的动力学蒙特卡洛模拟。统一建模方法便于软件开发与性能优化。将粒子存储、并行与通信算法及势函数独立出来形成单独模块,可便于MD、KMC软件开发模块间的解耦;在超算架构上进行性能优化时,其效果可直接同时作用于上层MD、KMC软件,起到“一处优化、两处提升”的效果,支撑MD、KMC模拟同时达到大规模模拟计算水平。
-
公开(公告)号:CN116150553A
公开(公告)日:2023-05-23
申请号:CN202310215144.8
申请日:2023-03-01
Applicant: 北京科技大学
Abstract: 本发明公开了一种面向CPU+DCU异构混合架构的稀疏化AMG优化方法,属于高性能计算与算法技术领域;本发明提出一种面向CPU+DCU异构混合架构的稀疏化AMG优化方法,在形成粗网格层次结构后,通过并行方式去除矩阵中的弱连接或不重要的元素(非零元素)来对层次矩阵进行稀疏化优化,可以降低后续设置阶段并行的通信成本。本发明还对粗网格矩阵生成过程中涉及到的大量三个矩阵乘运算针对超算CPU+DCU异构混合架构进行并行优化,进一步提升了AMG方法的预处理效率。
-
公开(公告)号:CN111695245B
公开(公告)日:2023-04-28
申请号:CN202010429538.X
申请日:2020-05-20
Applicant: 北京科技大学
Abstract: 本发明提供一种材料辐照损伤空间分辨随机团簇动力学并行模拟方法,能够实现大规模SRSCD模拟。所述方法包括:将空间分辨随机团簇动力学的模拟体积分配给不同的进程并建立进程的三维笛卡尔拓扑结构,并将进程的区域划分为若干个扇区;确定通信数据结构;按扇区编号顺序依次遍历每一个扇区,计算每个扇区内循环的时间阈值进入内循环,在当前扇区中随机选择一个反应,根据选择的反应更新缺陷、填充通信数据列表并更新相关反应,当内循环的演化时间大于内循环的时间阈值时,与邻居进程进行通信,同步相应的缺陷信息并更新相关的反应。本发明涉及面向核材料辐照损伤模拟技术领域和并行计算领域。
-
-
-
-
-
-
-
-
-