-
公开(公告)号:CN114218062A
公开(公告)日:2022-03-22
申请号:CN202110425772.X
申请日:2021-04-20
Applicant: 无锡江南计算技术研究所
IPC: G06F11/36
Abstract: 本发明公开一种测试程序批量变种方法,包括以下步骤:S1、对测试程序源码进行分析,确定核心代码段区间;S2、得到核心段代码调用的函数代码;S3、对于改变程序执行路径的测试程序,将其核心代码段进行复制并使用if/else结构对两段相同的核心代码段进行区分,将S2得到的核心段代码调用的函数代码复制,将其中一份函数代码的函数名加上后缀,同时将if/else结构中if条件内的代码段调用的函数加上后缀;S4、得到变种程序源码;S5、将变种程序源码编译成汇编代码;S6、得到变种汇编代码;S7、将变种汇编代码编译成可执行文件。本发明解决了高速缓存一致性测试程序集合中的程序不够丰富,覆盖面不够全面的问题。
-
公开(公告)号:CN114217935A
公开(公告)日:2022-03-22
申请号:CN202110209591.3
申请日:2021-02-25
Applicant: 无锡江南计算技术研究所
IPC: G06F9/50 , G06F17/18 , G06F12/0884
Abstract: 本发明公开一种解决耦合器插值计算的众核并行优化算法,包括以下步骤:S1、运行插值计算程序,并根据插值计算程序的运行结果获取插值计算中的核心代码;S2、针对S1中获取的核心代码,逐行进行分析,获取核心代码中作为输入输出变量的全局变量;S3、对S2中获取的全局变量,按照数据结构复杂度分为基础数据类型变量与复杂数据类型变量两类;S4、分析通过S3分类获得的每个复杂数据类型变量;S5、将通过S3分类获得的复杂数据类型变量进行数据结构优化;S6、使用按照上述步骤编写的代码替换插值计算程序中相对应的代码,重新进行程序的编译和运行。本发明能够大幅度减少从核的离散访存开销,极大程度的提高众核并行程序的运算速度,最终提高地球系统模式的性能。
-
公开(公告)号:CN109684061A
公开(公告)日:2019-04-26
申请号:CN201811583475.2
申请日:2018-12-24
Applicant: 无锡江南计算技术研究所
CPC classification number: G06F9/4881 , G06F9/5066 , G06F9/5083 , G06F2209/5018
Abstract: 本发明公开一种非结构网格众核粗粒度并行计算方法,该方法在第一级非结构网格的区域分解的基础上增加了第二级的线程级区域分解,每个从核求解各自的独立计算区域,保证从核核心计算任务的数据命中率,实现MPI进程级的粗粒度并行和从核线程级的粗粒度并行。本发明能够解决一般非结构网格应用在多态异构处理器上的适应性问题,根据非结构网格数据规模自动完成二级负载平衡和计算核心的粗粒度众核并行,提高了异构体系结构上非结构网格数值模拟的计算效率和并行效率。
-
公开(公告)号:CN112559952B
公开(公告)日:2023-07-07
申请号:CN201910918627.8
申请日:2019-09-26
Applicant: 无锡江南计算技术研究所
IPC: G06F17/14
Abstract: 本发明公开一种基于序列分层的异构众核快速傅里叶变换方法,包括以下步骤:S1、将待转序列按FFT运算层序进行分块,分块大小为当前运算层一次基本运算的子序列大小,即第1次分块时,每个分块的大小为2,即将输入序列分成大小为2的若干个小块;第2次分块时,每个分块的大小为4,即将输入序列分成大小为4的若干个小块;以此类推,第n次分块时,每个分块的大小为2n,即将输入序列分成大小为2n的若干个小块;一直分到每个分块的大小与输入序列的长度相同为止;S2、将每一层的分块并行地利用异构众核架构进行加速运算,通过片上网络实现分块内部的众核加速。本发明提高大规模数据的FFT算法性能。
-
公开(公告)号:CN114218846A
公开(公告)日:2022-03-22
申请号:CN202110324746.8
申请日:2021-03-26
Applicant: 无锡江南计算技术研究所
IPC: G06F30/27 , G06F119/02
Abstract: 本发明公开一种超级计算机计算资源故障预测方法,包括以下步骤:S1、每隔s秒采集一个计算节点的特征信息,记为x1s;N个s秒为时间窗口T;S2、经过m个时间窗口T的数据积累,得到m个总特征X作为输入样本;S3、将S2中经数据处理后的m个总特征X和对应状态Y按batch大小划分成组;S4、从(m+1)个时间窗口T开始,将采集到的最新的总特征X_test和对应状态Y_test根据S2进行数据处理;S5、设置阈值并对比预测结果Y’和对应状态Y_test,当偏差大于设定的阈值时,将训练模型进行调参重训练,重复S4。本发明解决了超级计算机计算资源故障难以有效提前预测的问题。
-
公开(公告)号:CN114217936A
公开(公告)日:2022-03-22
申请号:CN202110209594.7
申请日:2021-02-25
Applicant: 无锡江南计算技术研究所
IPC: G06F9/50
Abstract: 本发明公开一种高效大气模式物理过程任务划分算法,包括以下步骤:S1、获取大气模式中各进程所在的超节点编号;S2、根据S1中获取的超节点编号信息,对大气模式中的各进程进行分组,将具有相同超节点编号的进程分到同一个组;S3、第一级任务划分,采用与动力框架采用相同的网格划分方式,保证同一组进程中大气模式动力框架与物理过程具有相同的网格;S4、第二级任务划分,调整大气模式物理过程中组内进程间网格划分,将网格重分配到组内进程中。本发明既能使大气模式物理过程计算任务相对平衡,又能减少大气模式与动力框架耦合时的通信开销,可显著提高大气模式大规模并行时的整体性能。
-
公开(公告)号:CN112560356A
公开(公告)日:2021-03-26
申请号:CN201910919675.9
申请日:2019-09-26
Applicant: 无锡江南计算技术研究所
IPC: G06F30/28 , G06F113/08 , G06F119/14
Abstract: 本发明公开了种面向众核架构的稀疏矩阵向量乘众核优化方法,包括以下步骤:S1、已知:行数为m,列数为n的稀疏矩阵A,长为n的向量x;求解长度为m的向量y,y=Ax为稀疏矩阵A与向量x的点积;S1、定义x向量块大小blk_x_size,根据x向量元素下标对x向量元素进行分块将x向量进行分块;S2、根据x向量的分块信息,即S1中求解得到的x向量元素所在的x向量块编号信息,统计原始稀疏矩阵即稀疏矩阵A中每一行非零元所在列号对应的x向量块的编号,由此统计出稀疏矩阵向量乘时稀疏矩阵每一行所需要的x向量块的编号信息。本发明提高了整体众核加速性能,提高数据访问的局部性,对非结构网格CFD应用的优化作用明显。
-
公开(公告)号:CN112559032A
公开(公告)日:2021-03-26
申请号:CN201910910103.4
申请日:2019-09-25
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种基于循环段的众核程序重构方法,包括基于循环段拆分的重构算法和基于循环段合并的重构算法,其中,所述基于循环段拆分的重构算法包括基于主从协同任务的循环段拆分和基于空间压缩的循环段拆分,所述基于循环段合并的重构算法包括基于相似结构的循环段合并和基于增加循环量的循环段合并。本发明根据异构系统的结构特点和性能指标,优化循环段的层次结构和顺序,充分发挥系统的性能优势,从而最大程序提高应用软件的计算性能。
-
公开(公告)号:CN112433829A
公开(公告)日:2021-03-02
申请号:CN201910788892.9
申请日:2019-08-26
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种以用户为核心的高性能计算机资源管理方法,基于以下模块:用户队列模块,包含所有使用高性能计算机系统的用户,每个用户可以使用1~2个有限队列资源;计算队列模块,可包含高性能计算机系统中所有的计算节点,且每个计算节点只能加入到一个计算队列;计算节点队列模块,将计算节点按照该节点的网络地址进行编号;资源管理系统,当用户队列模块中的用户向计算队列模块中的计算队列提交作业时,用于判断该用户下面是否包含有该队列。本发明解决了大型超算中心计算资源管理低效问题,提高高性能计算机系统计算资源的管理和服务能力。
-
-
-
-
-
-
-
-
-