-
公开(公告)号:CN112445604A
公开(公告)日:2021-03-05
申请号:CN201910799249.6
申请日:2019-08-28
Applicant: 无锡江南计算技术研究所
IPC: G06F9/50
Abstract: 本发明公开一种解决非结构网格离散访存问题众核并行优化算法,包括以下步骤:S1、将网格单元周围的网格面通量数据分为若干数据块,并将不同数据块定义为不同属性;S2、将分块后的数据块并行拷入各个从核中;S3、各从核并行遍历拷入的数据块中的数据,按照该数据所对应的l(u)所在的位置,对一个数据块中的若干数据进行局部重排,并记录重排后各个数据位置索引;S4、各从核分别从主存中拷入一个通量数据块,并根据S3记录的位置索引,从重排序后的暂存空间中,拷入通量数据块所需要的Lower数据、Upper数据进行计算。本发明对非结构网格离散访存问题进行基于众核的重排序优化,极大减少了离散访存时间,提高该类问题的求解效率,从而提高整个应用系统的运行效率。
-
公开(公告)号:CN112559032B
公开(公告)日:2023-06-13
申请号:CN201910910103.4
申请日:2019-09-25
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种基于循环段的众核程序重构方法,包括基于循环段拆分的重构算法和基于循环段合并的重构算法,其中,所述基于循环段拆分的重构算法包括基于主从协同任务的循环段拆分和基于空间压缩的循环段拆分,所述基于循环段合并的重构算法包括基于相似结构的循环段合并和基于增加循环量的循环段合并。本发明根据异构系统的结构特点和性能指标,优化循环段的层次结构和顺序,充分发挥系统的性能优势,从而最大程序提高应用软件的计算性能。
-
公开(公告)号:CN112445603A
公开(公告)日:2021-03-05
申请号:CN201910799247.7
申请日:2019-08-28
Applicant: 无锡江南计算技术研究所
IPC: G06F9/50
Abstract: 本发明公开一种非结构网格主从动态并行预处理方法,基于由多个物理块构成的千万及以上量级规模的网格,包括以下步骤:S1、主进程按照物理块顺序分配任务,将每个物理块的网格信息分发至各从进程;S2、从进程接收来自主进程的任务,并对每个物理块内的网格单元进行预处理;S3、从进程将预处理结果发回至主进程,并向主进程申请下一组网格进行预处理;S4、主进程将所有网格组分发完后,向从进程发送结束信号;S5、从进程收到结束信号后,从进程结束。本发明能满足千万及以上量级网格规模的数值模拟需求,解决大规模非结构网格预处理内存需求过大和效率低的问题。
-
公开(公告)号:CN114217936A
公开(公告)日:2022-03-22
申请号:CN202110209594.7
申请日:2021-02-25
Applicant: 无锡江南计算技术研究所
IPC: G06F9/50
Abstract: 本发明公开一种高效大气模式物理过程任务划分算法,包括以下步骤:S1、获取大气模式中各进程所在的超节点编号;S2、根据S1中获取的超节点编号信息,对大气模式中的各进程进行分组,将具有相同超节点编号的进程分到同一个组;S3、第一级任务划分,采用与动力框架采用相同的网格划分方式,保证同一组进程中大气模式动力框架与物理过程具有相同的网格;S4、第二级任务划分,调整大气模式物理过程中组内进程间网格划分,将网格重分配到组内进程中。本发明既能使大气模式物理过程计算任务相对平衡,又能减少大气模式与动力框架耦合时的通信开销,可显著提高大气模式大规模并行时的整体性能。
-
公开(公告)号:CN112559032A
公开(公告)日:2021-03-26
申请号:CN201910910103.4
申请日:2019-09-25
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种基于循环段的众核程序重构方法,包括基于循环段拆分的重构算法和基于循环段合并的重构算法,其中,所述基于循环段拆分的重构算法包括基于主从协同任务的循环段拆分和基于空间压缩的循环段拆分,所述基于循环段合并的重构算法包括基于相似结构的循环段合并和基于增加循环量的循环段合并。本发明根据异构系统的结构特点和性能指标,优化循环段的层次结构和顺序,充分发挥系统的性能优势,从而最大程序提高应用软件的计算性能。
-
公开(公告)号:CN112559031A
公开(公告)日:2021-03-26
申请号:CN201910910099.1
申请日:2019-09-25
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种基于数据结构的众核程序重构方法,包括基于提取基本类型数据结构的重构方法、基于数组降维的空间压缩的重构方法、基于增大传输字长的空间压缩的重构方法。本发明主要针对多级异构众核并行计算问题中多样化的数据结构,提供高效的数据结构重构方法,提高异构并行程序的计算效率。
-
公开(公告)号:CN112559031B
公开(公告)日:2022-10-04
申请号:CN201910910099.1
申请日:2019-09-25
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种基于数据结构的众核程序重构方法,包括基于提取基本类型数据结构的重构方法、基于数组降维的空间压缩的重构方法、基于增大传输字长的空间压缩的重构方法。本发明主要针对多级异构众核并行计算问题中多样化的数据结构,提供高效的数据结构重构方法,提高异构并行程序的计算效率。
-
公开(公告)号:CN114217935A
公开(公告)日:2022-03-22
申请号:CN202110209591.3
申请日:2021-02-25
Applicant: 无锡江南计算技术研究所
IPC: G06F9/50 , G06F17/18 , G06F12/0884
Abstract: 本发明公开一种解决耦合器插值计算的众核并行优化算法,包括以下步骤:S1、运行插值计算程序,并根据插值计算程序的运行结果获取插值计算中的核心代码;S2、针对S1中获取的核心代码,逐行进行分析,获取核心代码中作为输入输出变量的全局变量;S3、对S2中获取的全局变量,按照数据结构复杂度分为基础数据类型变量与复杂数据类型变量两类;S4、分析通过S3分类获得的每个复杂数据类型变量;S5、将通过S3分类获得的复杂数据类型变量进行数据结构优化;S6、使用按照上述步骤编写的代码替换插值计算程序中相对应的代码,重新进行程序的编译和运行。本发明能够大幅度减少从核的离散访存开销,极大程度的提高众核并行程序的运算速度,最终提高地球系统模式的性能。
-
公开(公告)号:CN109684061A
公开(公告)日:2019-04-26
申请号:CN201811583475.2
申请日:2018-12-24
Applicant: 无锡江南计算技术研究所
CPC classification number: G06F9/4881 , G06F9/5066 , G06F9/5083 , G06F2209/5018
Abstract: 本发明公开一种非结构网格众核粗粒度并行计算方法,该方法在第一级非结构网格的区域分解的基础上增加了第二级的线程级区域分解,每个从核求解各自的独立计算区域,保证从核核心计算任务的数据命中率,实现MPI进程级的粗粒度并行和从核线程级的粗粒度并行。本发明能够解决一般非结构网格应用在多态异构处理器上的适应性问题,根据非结构网格数据规模自动完成二级负载平衡和计算核心的粗粒度众核并行,提高了异构体系结构上非结构网格数值模拟的计算效率和并行效率。
-
-
-
-
-
-
-
-