-
公开(公告)号:CN118152107A
公开(公告)日:2024-06-07
申请号:CN202311676312.X
申请日:2023-12-08
Applicant: 杭州电子科技大学 , 中国科学院计算机网络信息中心
IPC: G06F9/50
Abstract: 本发明公开了一种用于DFPT分析的多级GPU负载均衡方法及系统,属于计算机高性能计算数值模拟领域。该方法首先基于密度泛函微扰分析的数据集,通过预运行确定批次负载。其次根据批次负载进行一级负载划分:进行卡间负载均衡划分,实现GPU卡间负载均衡。最后进行二级负载划分:进行卡内负载均衡划分,实现GPU卡内负载均衡。该系统包括负载确定模块、一级负载划分模块和二级负载划分模块。本发明改善了现有负载均衡策略由于没有针对性的优化,难以应对GPU加速后的密度泛函微扰分析的问题,提高了资源利用率以及运算效率。
-
公开(公告)号:CN116562333A
公开(公告)日:2023-08-08
申请号:CN202310332005.3
申请日:2023-03-30
Applicant: 中国科学院计算机网络信息中心 , 杭州电子科技大学
Abstract: 本发明提供一种针对物理神经网络的改进网络的调优方法和装置。该方法包括:为所述基础的物理神经网络添加输入放缩层,输出放缩层和特征层,构建改进的物理神经网络;使用若干观测点和所述改进的物理神经网络作差作为第一损失函数对所述改进的物理神经网络进行第一训练;将所述微分方程组的残差项加入到所述第一损失函数得到第二损失函数进行第二训练。实现了使用物理神经网络求解强刚性的速率理论方程组的可行性,添加观测点作为有监督训练项并进行预训练,确定模型的优化方向,使模型训练具有更高的训练效率。采用均衡各残差权重的优化方法,让改进的网络具有更好的正则化效果。
-
公开(公告)号:CN112733401A
公开(公告)日:2021-04-30
申请号:CN202011607981.8
申请日:2020-12-30
Applicant: 杭州电子科技大学 , 中国科学院计算机网络信息中心
Abstract: 本发明公开一种面向反应堆堆芯组件数值模拟的有限元撕裂对接法及系统。n个计算节点中每个计算节点均设有上述有限元撕裂对接系统,每个计算节点拥有g块类GPU加速器。本发明采用了负载均衡策略,使得各进程的稠密矩阵内存大小趋于平均值,充分利用集群资源,加快求解速度。采用HIP编程,使得有限元撕裂对接法运行在NvidiaCUDA平台和AMDROMc平台。在迭代求解过程的稠密矩阵向量乘阶段中,采用动态分配矩阵策略,使得不同处理器分配到合适的计算量,以充分利用计算资源,加快求解速度。在向量内积阶段,采用了向量内积加速策略和通信计算重叠策略,通过引入通信线程,减少通信等待时间,加快向量内积速度。
-
公开(公告)号:CN112464540A
公开(公告)日:2021-03-09
申请号:CN202011495076.8
申请日:2020-12-17
Applicant: 杭州电子科技大学 , 中国科学院计算机网络信息中心
IPC: G06F30/23 , G06F111/10
Abstract: 本发明提供一种适用于数值反应堆的大规模并行网格生成方法和系统,包括基于无锁原子操作的网格单元构造方法,用于提高多线程网格构造效率,避免线程阻塞等待;基于OpenMP框架的并行网格转换方法,用于加快网格转换过程,缩短网格转换时间;网格生成器与求解器集成方法,用于避免网格文件写入、读取的I/O时长。本发明满足了大规模并行网格生成的巨大需求,用户能够在更短的时间内获得指定规模的网格,且能够保证良好的网格质量。本发明提出的将网格生成器与求解器集成的方案,能形成整体的数值模拟框架,降低用户使用成本,并且进一步缩短网格生成时间。
-
公开(公告)号:CN112733401B
公开(公告)日:2024-03-12
申请号:CN202011607981.8
申请日:2020-12-30
Applicant: 杭州电子科技大学 , 中国科学院计算机网络信息中心
Abstract: 本发明公开一种面向反应堆堆芯组件数值模拟的有限元撕裂对接法及系统。n个计算节点中每个计算节点均设有上述有限元撕裂对接系统,每个计算节点拥有g块类GPU加速器。本发明采用了负载均衡策略,使得各进程的稠密矩阵内存大小趋于平均值,充分利用集群资源,加快求解速度。采用HIP编程,使得有限元撕裂对接法运行在NvidiaCUDA平台和AMDROMc平台。在迭代求解过程的稠密矩阵向量乘阶段中,采用动态分配矩阵策略,使得不同处理器分配到合适的计算量,以充分利用计算资源,加快求解速度。在向量内积阶段,采用了向量内积加速策略和通信计算重叠策略,通过引入通信线程,减少通信等待时间,加快向量内积速度。
-
公开(公告)号:CN115392081A
公开(公告)日:2022-11-25
申请号:CN202211012953.0
申请日:2022-08-23
Applicant: 杭州电子科技大学 , 中国科学院计算机网络信息中心
IPC: G06F30/23 , G06F30/28 , G06F111/10 , G06F113/08 , G06F119/14
Abstract: 本发明公开了一种基于FETI的高精细流致振动模拟方法,首先读入相应的算例数据,并采用NewMark方法对流致振动动力学过程进行数值离散。其次采用FETI方法对离散后的方程进行并行分解,子域在划分边界处由拉格朗日乘子进行粘合,提出域边界平衡的图二分算法,均衡各子域中的单元量和计算量,保证进程间负载均衡。最后采用预处理共轭梯度法进行迭代求解,迭代求解得到,根据得到相应的位移,根据位移,NewMark方法实现流致振动过程的时间步更新。本发明完成了数亿规模的网格数据求解,提高了求解大规模流致振动问题的效率,实现了流致振动的快速高效模拟,并且保证了进程间的负载均衡。
-
公开(公告)号:CN112464540B
公开(公告)日:2024-10-01
申请号:CN202011495076.8
申请日:2020-12-17
Applicant: 杭州电子科技大学 , 中国科学院计算机网络信息中心
IPC: G06F30/23 , G06F111/10
Abstract: 本发明提供一种适用于数值反应堆的大规模并行网格生成方法和系统,包括基于无锁原子操作的网格单元构造方法,用于提高多线程网格构造效率,避免线程阻塞等待;基于OpenMP框架的并行网格转换方法,用于加快网格转换过程,缩短网格转换时间;网格生成器与求解器集成方法,用于避免网格文件写入、读取的I/O时长。本发明满足了大规模并行网格生成的巨大需求,用户能够在更短的时间内获得指定规模的网格,且能够保证良好的网格质量。本发明提出的将网格生成器与求解器集成的方案,能形成整体的数值模拟框架,降低用户使用成本,并且进一步缩短网格生成时间。
-
公开(公告)号:CN119475671B
公开(公告)日:2025-04-29
申请号:CN202411410041.8
申请日:2024-10-10
Applicant: 中国科学院计算机网络信息中心
IPC: G06F30/20
Abstract: 一种材料辐照损伤原子动力学蒙特卡洛模拟方法,包括:GPU基于原子信息数组,获取当前扇区中处于表面区域的空位,及空位的相关邻近位;基于空位及相关邻近位,确定当前扇区内空位的跃迁速率;同时获取下一扇区的预取空位,以及预取空位的相关邻近位;预取空位不处于表面区域,也不处于幽灵区域;基于跃迁速率,确定并执行事件,更新幽灵区域;执行事件是指当前空位与第一近邻位置交换;在执行事件的累计时间大于扇区通信阈值的情况下,当前进程将幽灵区域中的更新同步给邻居进程,同时获取下一扇区表面区域的空位,基于下一扇区表面区域的空位与预取空位,计算下一扇区的跃迁速率。本方法通过当前扇区的通信和计算重叠,提高了资源的利用率。
-
公开(公告)号:CN119475671A
公开(公告)日:2025-02-18
申请号:CN202411410041.8
申请日:2024-10-10
Applicant: 中国科学院计算机网络信息中心
IPC: G06F30/20
Abstract: 一种材料辐照损伤原子动力学蒙特卡洛模拟方法,包括:GPU基于原子信息数组,获取当前扇区中处于表面区域的空位,及空位的相关邻近位;基于空位及相关邻近位,确定当前扇区内空位的跃迁速率;同时获取下一扇区的预取空位,以及预取空位的相关邻近位;预取空位不处于表面区域,也不处于幽灵区域;基于跃迁速率,确定并执行事件,更新幽灵区域;执行事件是指当前空位与第一近邻位置交换;在执行事件的累计时间大于扇区通信阈值的情况下,当前进程将幽灵区域中的更新同步给邻居进程,同时获取下一扇区表面区域的空位,基于下一扇区表面区域的空位与预取空位,计算下一扇区的跃迁速率。本方法通过当前扇区的通信和计算重叠,提高了资源的利用率。
-
公开(公告)号:CN111079921A
公开(公告)日:2020-04-28
申请号:CN201911197354.9
申请日:2019-11-29
Applicant: 杭州电子科技大学舟山同博海洋电子信息研究院有限公司 , 杭州电子科技大学
Abstract: 本发明公开了一种基于异构分布式系统的高效神经网络训练调度方法。本发明首先通过资源探测系统探测并分析分布式系统中的资源动态变化;将训练过程分解为内迭代与外迭代作为任务调度系统的重要子集,并根据资源探测系统提供的分布式系统节点状态信息,随后任务调度系统自适应地修改环境参数并调度计算。在公开数据集下进行的相关实验表明,在保证高准确率、收敛率的前提下,本发明具有更好的鲁棒性和可扩展性。
-
-
-
-
-
-
-
-
-