-
公开(公告)号:CN112559952B
公开(公告)日:2023-07-07
申请号:CN201910918627.8
申请日:2019-09-26
Applicant: 无锡江南计算技术研究所
IPC: G06F17/14
Abstract: 本发明公开一种基于序列分层的异构众核快速傅里叶变换方法,包括以下步骤:S1、将待转序列按FFT运算层序进行分块,分块大小为当前运算层一次基本运算的子序列大小,即第1次分块时,每个分块的大小为2,即将输入序列分成大小为2的若干个小块;第2次分块时,每个分块的大小为4,即将输入序列分成大小为4的若干个小块;以此类推,第n次分块时,每个分块的大小为2n,即将输入序列分成大小为2n的若干个小块;一直分到每个分块的大小与输入序列的长度相同为止;S2、将每一层的分块并行地利用异构众核架构进行加速运算,通过片上网络实现分块内部的众核加速。本发明提高大规模数据的FFT算法性能。
-
公开(公告)号:CN114217936A
公开(公告)日:2022-03-22
申请号:CN202110209594.7
申请日:2021-02-25
Applicant: 无锡江南计算技术研究所
IPC: G06F9/50
Abstract: 本发明公开一种高效大气模式物理过程任务划分算法,包括以下步骤:S1、获取大气模式中各进程所在的超节点编号;S2、根据S1中获取的超节点编号信息,对大气模式中的各进程进行分组,将具有相同超节点编号的进程分到同一个组;S3、第一级任务划分,采用与动力框架采用相同的网格划分方式,保证同一组进程中大气模式动力框架与物理过程具有相同的网格;S4、第二级任务划分,调整大气模式物理过程中组内进程间网格划分,将网格重分配到组内进程中。本发明既能使大气模式物理过程计算任务相对平衡,又能减少大气模式与动力框架耦合时的通信开销,可显著提高大气模式大规模并行时的整体性能。
-
公开(公告)号:CN112559032A
公开(公告)日:2021-03-26
申请号:CN201910910103.4
申请日:2019-09-25
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种基于循环段的众核程序重构方法,包括基于循环段拆分的重构算法和基于循环段合并的重构算法,其中,所述基于循环段拆分的重构算法包括基于主从协同任务的循环段拆分和基于空间压缩的循环段拆分,所述基于循环段合并的重构算法包括基于相似结构的循环段合并和基于增加循环量的循环段合并。本发明根据异构系统的结构特点和性能指标,优化循环段的层次结构和顺序,充分发挥系统的性能优势,从而最大程序提高应用软件的计算性能。
-
公开(公告)号:CN117992715A
公开(公告)日:2024-05-07
申请号:CN202410173432.6
申请日:2024-02-07
Applicant: 无锡江南计算技术研究所
Abstract: 本申请实施例公开了一种基于异构众核的对界融合批量浮点精度转换方法。该方法包括:将目标矩阵数据中同一预设维度的数据作为一个子矩阵数据;其中,预设维度为行或者列;根据所述子矩阵数据的数据量以及所述计算核心的局部存储空间,确定需要所述计算核心处理的目标子矩阵数据以及处理方式;通过所述计算核心基于所述处理方式对所述目标子矩阵数据进行处理。上述方案能够解决目前遍历目标矩阵数据进行精度转换过程中,数据访问量大、效率低的问题,从而通过异构众核结构对目标矩阵数据进行处理,提高同时处理的数据量,提高数据处理效率。
-
公开(公告)号:CN117332194A
公开(公告)日:2024-01-02
申请号:CN202311343967.5
申请日:2023-10-17
Applicant: 无锡江南计算技术研究所
Abstract: 本发明实施例公开了一种高阶龙格库塔法的混合精度处理方法、装置及设备。该方法包括:获取待处理业务对应的标准业务表达式;对标准业务表达式进行处理,得到目标业务表达式;确定目标业务表达式中的目标数据项;基于高阶Runge‑Kutta龙格库塔法,确定目标数据项的候选阶数;根据候选阶数,确定目标业务表达式的当前目标阶数;根据当前目标阶数,确定对应的目标精度格式;其中,目标精度格式基于混合精度格式确定;根据目标精度格式对目标业务表达式进行处理,得到业务结果。上述方案,实现了在考虑候选阶数的基础上,对目标业务表达式进行处理,提高了对目标业务表达式进行处理的准确度,减少了计算资源和能耗的浪费。
-
公开(公告)号:CN112559952A
公开(公告)日:2021-03-26
申请号:CN201910918627.8
申请日:2019-09-26
Applicant: 无锡江南计算技术研究所
IPC: G06F17/14
Abstract: 本发明公开一种基于序列分层的异构众核快速傅里叶变换方法,包括以下步骤:S1、将待转序列按FFT运算层序进行分块,分块大小为当前运算层一次基本运算的子序列大小,即第1次分块时,每个分块的大小为2,即将输入序列分成大小为2的若干个小块;第2次分块时,每个分块的大小为4,即将输入序列分成大小为4的若干个小块;以此类推,第n次分块时,每个分块的大小为2n,即将输入序列分成大小为2n的若干个小块;一直分到每个分块的大小与输入序列的长度相同为止;S2、将每一层的分块并行地利用异构众核架构进行加速运算,通过片上网络实现分块内部的众核加速。本发明提高大规模数据的FFT算法性能。
-
公开(公告)号:CN112559435A
公开(公告)日:2021-03-26
申请号:CN201910918612.1
申请日:2019-09-26
Applicant: 无锡江南计算技术研究所
IPC: G06F15/173
Abstract: 本发明公开一种基于片上分块的大规模三维矩阵转置的众核并行优化方法,包括以下步骤:S1、根据三维数组的最高维对每个从核的任务进行划分,利用异构众核访存接口实现数据的快速传输;S2、利用片上加速接口对矩阵进行分块,通过片上加速接口对每个分块进行加速运算。本发明将三维数组进行片上分块,利用异构众核架构对分块进行并行加速,实现高效的数组转置,适用于绝大多数数值计算中需要对大规模三维矩阵转置的众多工程应用软件,极大的提高程序整体性能。
-
公开(公告)号:CN112559032B
公开(公告)日:2023-06-13
申请号:CN201910910103.4
申请日:2019-09-25
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种基于循环段的众核程序重构方法,包括基于循环段拆分的重构算法和基于循环段合并的重构算法,其中,所述基于循环段拆分的重构算法包括基于主从协同任务的循环段拆分和基于空间压缩的循环段拆分,所述基于循环段合并的重构算法包括基于相似结构的循环段合并和基于增加循环量的循环段合并。本发明根据异构系统的结构特点和性能指标,优化循环段的层次结构和顺序,充分发挥系统的性能优势,从而最大程序提高应用软件的计算性能。
-
公开(公告)号:CN115271078A
公开(公告)日:2022-11-01
申请号:CN202210933684.5
申请日:2022-08-04
Applicant: 无锡江南计算技术研究所
Abstract: 一种超级计算机与量子计算机协同的软件栈及工作方法,属于量子计算技术领域。本发明的软件栈包括:经典与量子协同编程框架:在经典编程模型框架中新增量子语言要素的扩展;异构融合编译环境:能够通过要素分析识别出经典与量子混合应用程序中的经典程序部分和量子程序部分;经典与量子协同操作系统:将硬件资源进行了抽象并提供相应的驱动程序;量子指令集:对量子计算机硬件系统进行控制的指令集,与量子物理体系进行耦合。本发明将超级计算机软件模型与量子计算机软件模型融合,即能够保证传统超级计算机正常运行,又能发挥量子加速计算的性能优势,推进量子计算机更广泛应用。
-
公开(公告)号:CN114218737A
公开(公告)日:2022-03-22
申请号:CN202110481531.7
申请日:2021-04-30
Applicant: 无锡江南计算技术研究所
IPC: G06F30/20 , G06F15/16 , G06F111/10
Abstract: 本发明公开一种基于国产众核架构的POM海洋模式众核优化方法,S1、分析源码,确定循环层数和每层循环量大小,并通过将小循环合并为大循环或者判断外移的方法将源代码修改成更适合众核化的代码;S2、更改众核代码;S3、用魔方旋转算法化多维stencil计算的跨步访存为连续访存;S4、对于不存在跨步访存且各维循环之间无相关性的代码,运用多维循环合并方法提高并行效率;S5、修改众核代码并验证正确性。本发明在众核架构计算机上充分利用众核的优势,提升不同大小规模数据的计算效率。
-
-
-
-
-
-
-
-
-