并行程序编译方法及系统
    21.
    发明授权

    公开(公告)号:CN101387965B

    公开(公告)日:2011-05-18

    申请号:CN200810224147.3

    申请日:2008-10-24

    Abstract: 本发明涉及一种并行程序编译方法,包括:数据划分步骤;数据重分布步骤;循环迭代划分步骤;循环迭代重分布步骤;通信I/O观测步骤;计算和通信的代码段生成步骤。本发明还涉及一种并行程序编译系统,包括:数据划分模块;数据重分布模块;循环迭代划分模块;循环迭代重分布模块;通信I/O观测模块;计算通信I/O操作代码段生成模块。本发明建立了核外非规则计算编译系统,简化了核外和非规则的并行计算问题,并提高该类程序的可移植性,该运行库基于消息传递MPI机制,具有用于支持并行程序的资源。

    一种国产DCU架构三维特征线中子输运计算加速方法

    公开(公告)号:CN119004574B

    公开(公告)日:2025-05-13

    申请号:CN202411011391.7

    申请日:2024-07-26

    Abstract: 本发明提供一种国产DCU架构三维特征线中子输运计算加速方法,属于高性能计算技术领域。所述方法包括:根据反应堆几何建模及域分解结构,构建均匀/非均匀粗网有限差分网格几何建模;轨迹生成及轨迹分段阶段,记录平源区与粗网网格和粗网网格与通信域的所属关系,存储到达粗网网格的顶点、边及面的轨迹段,存储位于域边界的轨迹段,记录相邻通信域间轨迹连接顺序,以及粗网网格面邻接关系;输运扫描阶段,依据域分解结构,将计算任务下发至设备端,根据轨迹段所属粗网网格点、边及面,存储轨迹段所属粗网网格表面中子流,存储位于通信域边界处需信息传递的中子流;将输运求解计算结果传递至粗网有限差分求解模块中,构建粗网有限差分方程组并使用逐次超松弛迭代法求解,根据计算结果更新各平源区通量并计算当前迭代中的有效中子增殖因子。

    一种细粒度并行I/O性能预测与I/O策略推荐方法及系统

    公开(公告)号:CN119690794A

    公开(公告)日:2025-03-25

    申请号:CN202411758105.3

    申请日:2024-12-03

    Abstract: 本发明公开了一种细粒度并行I/O性能预测与I/O策略推荐方法及系统,所述方法包括:基于动态库拦截技术采集与I/O性能相关的细粒度数据并存储,得到性能记录集合;对集合的数据进行分类,依据分类规则形成n个分类集合,针对每个分类集合构建并训练性能预测模型;通过调用性能预测模型,计算候选I/O策略中每种策略的总性能开销,并选择性能开销最小的I/O策略作为优化推荐方案。本发明方案能够全面捕捉并行I/O函数的性能特征,利用细粒度I/O性能数据实现高精度性的性能预测,通过分析细粒度信息以识别大规模并行应用程序的I/O性能瓶颈,实现应用程序的I/O模块的性能调优和整体程序的性能优化,有效提升整体应用的性能。

    一种基于深度学习的三维位错相互作用力的预测方法

    公开(公告)号:CN119046897A

    公开(公告)日:2024-11-29

    申请号:CN202411070230.5

    申请日:2024-08-06

    Abstract: 本发明公开了一种基于深度学习的三维位错相互作用力的预测方法,属于核材料辐照损伤计算模拟应用技术领域;本发明提出一种基于深度学习的三维位错相互作用力的预测方法,基于开源软件生成可用的数据集,设计了数据预处理的标准化方法,有效消除了数据集里的量纲差异性;通过数据预处理、训练后,生成的回归模型预测位错段间的相互作用力是一种灵活、准确、计算效率更高的方法,将有效加速预测三维位错相互作用力,能够大幅提高离散位错动力学(DDD)在三维位错建模时的模拟效率。

    一种同步并行空间分辨随机团簇动力学的通信方法

    公开(公告)号:CN111695243B

    公开(公告)日:2023-05-12

    申请号:CN202010429131.7

    申请日:2020-05-20

    Abstract: 本发明提供一种同步并行空间分辨随机团簇动力学的通信方法,能够减少通信开销,并提高并行效率。所述方法包括:为空间分辨随机团簇动力学的模拟区域建立三维进程拓扑结构;根据建立的三维进程拓扑结构,将一个KMC步内的多次发送/接收操作合并为一次,当前进程利用非阻塞通信与邻居进程建立通信发送/接收缺陷信息,更新当前进程的缺陷信息,其中,KMC表示动力学蒙特卡洛。本发明涉及面向核材料模拟技术领域和并行计算领域。

    一种快中子反应堆全堆芯子通道并行任务划分方法及系统

    公开(公告)号:CN111008070B

    公开(公告)日:2023-05-12

    申请号:CN201911262033.2

    申请日:2019-12-10

    Abstract: 本发明提供一种快中子反应堆全堆芯子通道并行任务划分方法及系统,所述方法包括:将待划分的快中子反应堆全堆芯子通道按照预设数据结构进行存储;基于预设数据结构,对当前组件内的所有子通道进行遍历,将当前组件内的子通道划分至预设数量的求解域中,完成当前组件的并行任务划分;将当前组件的并行任务划分结果应用于快中子反应堆全堆芯中所有组件,以完成快中子反应堆全堆芯子通道并行任务划分。本发明方法基于特定的数据结构和划分算法实现了快堆全堆芯的并行任务划分,使得热工流体子通道模拟软件能够大规模并行求解快堆问题,对于提升快堆全堆芯子通道模拟效率有着重要意义。

    一种反应堆燃料元件性能并行化处理方法

    公开(公告)号:CN110990158B

    公开(公告)日:2023-03-21

    申请号:CN201911276957.8

    申请日:2019-12-12

    Abstract: 本发明提供一种反应堆燃料元件性能并行化处理方法,能够实现对燃料元件性能的并行化处理,处理速度快、耗时短。所述方法包括:分配进程,每个进程用于进行单根燃料棒的性能分析;通过主进程读取输入文件的路径,将读取的路径广播给子进程,其中,输入文件包括:若干根燃料棒的参数信息;各进程根据接收到的路径读取相应燃料棒在输入文件中的参数信息,并根据读取的参数信息对相应的燃料棒进行性能分析,输出各进程的性能分析文件;主进程读取所有进程的性能分析文件,并将其写到同一个性能分析文件中。本发明涉及计算材料学、核科学与技术领域。

    一种稀疏矩阵向量乘访存优化的计算方法

    公开(公告)号:CN114491402A

    公开(公告)日:2022-05-13

    申请号:CN202210066814.X

    申请日:2022-01-20

    Abstract: 本发明公开了一种稀疏矩阵向量乘访存优化的计算方法,适用于DCU和GPU架构,该方法包括:将原始稀疏矩阵按照固定行数划分为若干块,每块由一个线程块单独完成计算,并为每个线程块在LDS开辟固定大小的空间;计算每一线程块需要计算的轮次数;在一个轮次的计算中,每个线程块中所有线程完成若干次非零元素计算并将结果写入LDS;每个线程块中一个或多个线程对LDS的乘法结果进行求和并将结果保存至寄存器;当完成所有轮次计算后,将寄存器中的结果进行进一步计算,并将结果写回显存。本发明基于原始CSR格式,无需预处理,且能充分利用访存合并特性,实现了较高的访存带宽利用。

Patent Agency Ranking