-
公开(公告)号:CN112559952B
公开(公告)日:2023-07-07
申请号:CN201910918627.8
申请日:2019-09-26
Applicant: 无锡江南计算技术研究所
IPC: G06F17/14
Abstract: 本发明公开一种基于序列分层的异构众核快速傅里叶变换方法,包括以下步骤:S1、将待转序列按FFT运算层序进行分块,分块大小为当前运算层一次基本运算的子序列大小,即第1次分块时,每个分块的大小为2,即将输入序列分成大小为2的若干个小块;第2次分块时,每个分块的大小为4,即将输入序列分成大小为4的若干个小块;以此类推,第n次分块时,每个分块的大小为2n,即将输入序列分成大小为2n的若干个小块;一直分到每个分块的大小与输入序列的长度相同为止;S2、将每一层的分块并行地利用异构众核架构进行加速运算,通过片上网络实现分块内部的众核加速。本发明提高大规模数据的FFT算法性能。
-
公开(公告)号:CN114218846A
公开(公告)日:2022-03-22
申请号:CN202110324746.8
申请日:2021-03-26
Applicant: 无锡江南计算技术研究所
IPC: G06F30/27 , G06F119/02
Abstract: 本发明公开一种超级计算机计算资源故障预测方法,包括以下步骤:S1、每隔s秒采集一个计算节点的特征信息,记为x1s;N个s秒为时间窗口T;S2、经过m个时间窗口T的数据积累,得到m个总特征X作为输入样本;S3、将S2中经数据处理后的m个总特征X和对应状态Y按batch大小划分成组;S4、从(m+1)个时间窗口T开始,将采集到的最新的总特征X_test和对应状态Y_test根据S2进行数据处理;S5、设置阈值并对比预测结果Y’和对应状态Y_test,当偏差大于设定的阈值时,将训练模型进行调参重训练,重复S4。本发明解决了超级计算机计算资源故障难以有效提前预测的问题。
-
公开(公告)号:CN114217936A
公开(公告)日:2022-03-22
申请号:CN202110209594.7
申请日:2021-02-25
Applicant: 无锡江南计算技术研究所
IPC: G06F9/50
Abstract: 本发明公开一种高效大气模式物理过程任务划分算法,包括以下步骤:S1、获取大气模式中各进程所在的超节点编号;S2、根据S1中获取的超节点编号信息,对大气模式中的各进程进行分组,将具有相同超节点编号的进程分到同一个组;S3、第一级任务划分,采用与动力框架采用相同的网格划分方式,保证同一组进程中大气模式动力框架与物理过程具有相同的网格;S4、第二级任务划分,调整大气模式物理过程中组内进程间网格划分,将网格重分配到组内进程中。本发明既能使大气模式物理过程计算任务相对平衡,又能减少大气模式与动力框架耦合时的通信开销,可显著提高大气模式大规模并行时的整体性能。
-
公开(公告)号:CN112560356A
公开(公告)日:2021-03-26
申请号:CN201910919675.9
申请日:2019-09-26
Applicant: 无锡江南计算技术研究所
IPC: G06F30/28 , G06F113/08 , G06F119/14
Abstract: 本发明公开了种面向众核架构的稀疏矩阵向量乘众核优化方法,包括以下步骤:S1、已知:行数为m,列数为n的稀疏矩阵A,长为n的向量x;求解长度为m的向量y,y=Ax为稀疏矩阵A与向量x的点积;S1、定义x向量块大小blk_x_size,根据x向量元素下标对x向量元素进行分块将x向量进行分块;S2、根据x向量的分块信息,即S1中求解得到的x向量元素所在的x向量块编号信息,统计原始稀疏矩阵即稀疏矩阵A中每一行非零元所在列号对应的x向量块的编号,由此统计出稀疏矩阵向量乘时稀疏矩阵每一行所需要的x向量块的编号信息。本发明提高了整体众核加速性能,提高数据访问的局部性,对非结构网格CFD应用的优化作用明显。
-
公开(公告)号:CN112559032A
公开(公告)日:2021-03-26
申请号:CN201910910103.4
申请日:2019-09-25
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种基于循环段的众核程序重构方法,包括基于循环段拆分的重构算法和基于循环段合并的重构算法,其中,所述基于循环段拆分的重构算法包括基于主从协同任务的循环段拆分和基于空间压缩的循环段拆分,所述基于循环段合并的重构算法包括基于相似结构的循环段合并和基于增加循环量的循环段合并。本发明根据异构系统的结构特点和性能指标,优化循环段的层次结构和顺序,充分发挥系统的性能优势,从而最大程序提高应用软件的计算性能。
-
公开(公告)号:CN112433829A
公开(公告)日:2021-03-02
申请号:CN201910788892.9
申请日:2019-08-26
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种以用户为核心的高性能计算机资源管理方法,基于以下模块:用户队列模块,包含所有使用高性能计算机系统的用户,每个用户可以使用1~2个有限队列资源;计算队列模块,可包含高性能计算机系统中所有的计算节点,且每个计算节点只能加入到一个计算队列;计算节点队列模块,将计算节点按照该节点的网络地址进行编号;资源管理系统,当用户队列模块中的用户向计算队列模块中的计算队列提交作业时,用于判断该用户下面是否包含有该队列。本发明解决了大型超算中心计算资源管理低效问题,提高高性能计算机系统计算资源的管理和服务能力。
-
-
公开(公告)号:CN114238067B
公开(公告)日:2025-04-11
申请号:CN202110480190.1
申请日:2021-04-30
Applicant: 无锡江南计算技术研究所
IPC: G06F11/362 , G06F18/23
Abstract: 本发明公开一种基于程序性能计数的异常进程快速定位方法,包括以下步骤:S1、用户提交应用作业;S2、作业调度器在启动应用作业的同时,在每个任务对应的处理器上初始化预设的硬件性能计数器;S3、若程序正常执行直至结束,则基于性能计数器实现的性能计数不对程序产生干扰;S4、若程序执行错误,则启动错误定位处理流程;S45、报告异常任务,用于进一步展开精确的错误原因定位。本发明有效提高了开发人员的调试开发效率、提升了系统资源利用率。
-
公开(公告)号:CN112559032B
公开(公告)日:2023-06-13
申请号:CN201910910103.4
申请日:2019-09-25
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种基于循环段的众核程序重构方法,包括基于循环段拆分的重构算法和基于循环段合并的重构算法,其中,所述基于循环段拆分的重构算法包括基于主从协同任务的循环段拆分和基于空间压缩的循环段拆分,所述基于循环段合并的重构算法包括基于相似结构的循环段合并和基于增加循环量的循环段合并。本发明根据异构系统的结构特点和性能指标,优化循环段的层次结构和顺序,充分发挥系统的性能优势,从而最大程序提高应用软件的计算性能。
-
公开(公告)号:CN115712583B
公开(公告)日:2023-04-18
申请号:CN202310023205.0
申请日:2023-01-09
Applicant: 之江实验室 , 无锡江南计算技术研究所
IPC: G06F12/0877 , G06F12/0884 , G06F12/0862 , G06F3/06 , G06N3/08
Abstract: 本发明公开了一种提升分布式缓存跨节点访问性能的方法及装置、介质。该方法依据轮次训练时预先生成的随机序列,在一个训练步骤中需要跨节点访问训练所需的样本时,查看当前步骤以及后续步骤所需的其他样本是否也存在于目标节点中,如果存在则将其一次性读取过来。本发明减少了训练过程中跨节点访问的次数带来的性能开销,有助于提升训练的总体性能。
-
-
-
-
-
-
-
-
-