一种用于材料位错动力学模拟异构优化的远程力加速方法

    公开(公告)号:CN119049608B

    公开(公告)日:2025-04-25

    申请号:CN202411120024.0

    申请日:2024-08-15

    Abstract: 本发明公开了一种用于材料位错动力学模拟异构优化的远程力加速方法,属于面向核材料辐照损伤计算模拟应用技术领域和高性能计算技术领域;本发明包括:(1)制定位错段归属规则:每个位错段在MLFMA中只归属一个单位,根据位错段的特性,确定位错段与单元的归属规则;(2)设计异构友好存储结构:分别针对上行遍历与下行遍历的特点,设计Dis_segment_vector和HashCellList两种异构存储连续的数据结构;(3)设计异构并行算法:利用异构友好的存储结构,分别针对最底层单元的位错段聚集和逐层位错因子转移操作,基于异构架构设计并行算法。本发明使借助多层展开层数增加的同时减少位错间相互作用计算成本,并保证最大限度降低总模拟时长,提高DDD的模拟速度。

    一种国产DCU架构下的三级粗网有限差分加速方法

    公开(公告)号:CN119272566A

    公开(公告)日:2025-01-07

    申请号:CN202411315677.4

    申请日:2024-09-20

    Abstract: 本发明提出一种面向国产DCU架构下的三级粗网有限差分加速方法,属于中子物理与高性能计算的交叉技术领域。所述方法包括:三维特征线输运扫描阶段,依据域分解方法,将计算任务下发至设备端(国产DCU),在DCU内,根据划分轨迹段所属粗网格顶点、边及面,存储轨迹段所属的粗网格表面中子流,存储位于通信域边界处需数据传递的中子流;三级粗网有限差分方法,将特征线三维特征线输运求解计算结果传递至三级粗网有限差分求解模块中,其中三级粗网有限差分在能群上和几何结构上进行多次粗化加速计算,即使用粗化程度更高的粗网来加速前一级粗网迭代计算,三级网格粗化程度由小到大表示为多能群栅元级网格、单能群栅元级网格和单能群组件级网格,然后构建各个级别的粗网有限差分方程组并使用逐次超松弛迭代法求解,最后根据计算结果更新各平源区通量并计算当前迭代中的有效中子增殖因子。本发明涉及中子物理与高性能计算的交叉技术领域。

    应用于螺旋结构流场DNS的并行六面体网格生成方法

    公开(公告)号:CN118966063A

    公开(公告)日:2024-11-15

    申请号:CN202411038507.6

    申请日:2024-07-31

    Abstract: 本发明公开了应用于螺旋结构流场DNS的并行六面体网格生成方法,属于计算流体力学技术领域;本发明提出一种应用于螺旋结构流场DNS的并行六面体网格生成方法,通过并行化处理和优化算法,有效地将螺旋结构复杂流场的混合网格转换为高质量的六面体网格,从而克服了传统方法中的自动化难题和高资源消耗问题。该技术不仅能够处理螺旋结构复杂流场中常见的复杂混合网格,还能在保持网格一致性的同时,显著提高转换效率和减少计算资源的需求,为基于谱元法的DNS提供了一个高效、可靠的网格生成解决方案。

    面向DCU集群的大规模有限元网格并行分区的方法及装置

    公开(公告)号:CN113239591B

    公开(公告)日:2023-10-27

    申请号:CN202110541398.X

    申请日:2021-05-18

    Abstract: 本发明涉及高性能计算技术领域,特别是指一种面向DCU集群的大规模有限元网格并行分区的方法及装置,该方法包括:将求解区域离散为网格,通过带权对偶图描述离散所得的网格的分布情况,其中,所述带权对偶图中的顶点表示网格,所述带权对偶图中的边表示网格间的连接关系,通过子图划分任务的并行,可以极大提高递归谱二分法划分的速度,而且,在子图划分并行之上,还可以进行谱二分法计算热点的并行,进一步缩短了有限元网格划分的处理时间,解决了串行递归谱二分法存在着划分大规模网格时间需求过长的问题,使得解决问题的效率大大提高。

    一种基于GPU合并访存的模板计算二维线程块选择方法

    公开(公告)号:CN116610424A

    公开(公告)日:2023-08-18

    申请号:CN202310209027.0

    申请日:2023-03-06

    Abstract: 本发明公开了一种基于GPU合并访存的模板计算二维线程块选择方法,属于高性能计算与算法技术领域;本发明包括如下步骤:S1、给定一个模板计算在二维平面内的半径,确定模板计算过程中一个二维线程块所需的数据形状;S2、基于合并访存技术,计算二维线程块的数据读取次数;给定浮点数精度,获取计算环境的相关信息,确定线程块的筛选条件;S3、依据S2中所述的筛选条件筛选出一个或多个合并访存技术需要的线程块,称为候选线程块;S4、给定开销指标并对其进行排序,依据开销指标从候选线程块中选出理论上最好的线程块,用于实际的GPU计算。本发明综合考虑了合并访存、bank冲突、负载平衡等影响因素,能够选择出计算性能较高的线程块。

Patent Agency Ranking