-
公开(公告)号:CN112559952A
公开(公告)日:2021-03-26
申请号:CN201910918627.8
申请日:2019-09-26
Applicant: 无锡江南计算技术研究所
IPC: G06F17/14
Abstract: 本发明公开一种基于序列分层的异构众核快速傅里叶变换方法,包括以下步骤:S1、将待转序列按FFT运算层序进行分块,分块大小为当前运算层一次基本运算的子序列大小,即第1次分块时,每个分块的大小为2,即将输入序列分成大小为2的若干个小块;第2次分块时,每个分块的大小为4,即将输入序列分成大小为4的若干个小块;以此类推,第n次分块时,每个分块的大小为2n,即将输入序列分成大小为2n的若干个小块;一直分到每个分块的大小与输入序列的长度相同为止;S2、将每一层的分块并行地利用异构众核架构进行加速运算,通过片上网络实现分块内部的众核加速。本发明提高大规模数据的FFT算法性能。
-
公开(公告)号:CN112540936A
公开(公告)日:2021-03-23
申请号:CN201910898087.1
申请日:2019-09-23
Applicant: 无锡江南计算技术研究所
IPC: G06F12/0877 , G06F13/16
Abstract: 本发明公开一种面向异构众核架构的离散访存读写方法,包括以下步骤:S1、将众核组共同组成一个存储块,将参与计算的物理量均匀分布在各计算核心的私有存储空间中,并通过建立索引关系可找到不同下标计算时数组的具体位置,再利用核间通信机制实现核间数据的访问;S2、利用步骤S1的映射同时结合非阻塞通信来批量获取数据,并将重排好的数据存入本地私有高速缓冲区中;S3、将步骤S1以预处理方式独立于计算之外,并根据课题需求可使用主从异步并行方式,继续隐藏建立映射过程带来的额外开销。本发明面向异构众核架构的离散访存读写方法,其利用分布式存储技术及其映射机制与高效非阻塞批处理数据重排方法,有效避免频繁的访主存,提高众核并行效率。
-
公开(公告)号:CN112527394A
公开(公告)日:2021-03-19
申请号:CN201910879931.6
申请日:2019-09-18
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种基于指令序列与消息序列指引的深度依赖问题并行方法,包括以下步骤:S1、将解向量按块进行平均划分,通过这种划分将解向量中各元素之间的依赖性转换成向量块之间的依赖性;S2、将一个向量块完成计算称为一次更新操作,此一次更新操作需要以下三个步骤:S21、部分更新:接收前继块发送的数据;S22、自我更新:对块内元素进行计算更新;S23、完成更新:将本向量块求解完毕的元素发送给所依赖的后继块;S3、众核内每个计算核心按顺序计算相应的向量块,重复S2的更新操作步骤,实现了整个流水线作业计算;S4、为每个计算核心设计一串指令流,即指令序列。本发明提高众核内部通信的相互协作性,减少访存时间开销,实现有效加速。
-
公开(公告)号:CN105678060B
公开(公告)日:2018-04-10
申请号:CN201511027453.4
申请日:2015-12-31
Applicant: 无锡江南计算技术研究所
Abstract: 一种数值预报产品实时处理方法,包括:使用数值预报系统计算预报数据,数值预报系统将每次计算的预报数据保存在文件系统中;采用预报产品生产服务进程,以服务运行方式,读取数值预报系统计算的预报数据,实时判断数值预报系统计算的预报数据是否加入了新数据,在加入了新数据的情况下,从文件系统中读入新数据进行更新;实时接收预报产品发布服务进程发送的针对预报区域内使用经纬度坐标确定的任意点的预报数据请求;响应于接收的针对该任意点的预报数据请求,对数值预报系统计算的预报数据进行实时处理,通过预定算法生成发布服务进程请求的预报区域内使用经纬度坐标确定的任意点的预报产品,将该任意点的预报产品返回给预报产品发布服务进程。
-
公开(公告)号:CN112559031B
公开(公告)日:2022-10-04
申请号:CN201910910099.1
申请日:2019-09-25
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种基于数据结构的众核程序重构方法,包括基于提取基本类型数据结构的重构方法、基于数组降维的空间压缩的重构方法、基于增大传输字长的空间压缩的重构方法。本发明主要针对多级异构众核并行计算问题中多样化的数据结构,提供高效的数据结构重构方法,提高异构并行程序的计算效率。
-
公开(公告)号:CN114218736A
公开(公告)日:2022-03-22
申请号:CN202110453194.0
申请日:2021-04-26
Applicant: 无锡江南计算技术研究所
IPC: G06F30/20 , G06F15/16 , G06F119/08
Abstract: 本发明公开一种针对海洋模式ROMS众核优化的方法,包括以下步骤:S1、查找、确认并分析海洋模式中的热点函数,找出热点函数的特点;S2、根据S1中的分析结果,找出排名前三的热点函数都是属于计算密集型、不涉及数据相关性、但存在跨步访存问题的函数;S3、对S2中获得的热点函数的计算部分,利用循环段程序重构,将跨步访存变为连续访存;S4、利用编译指示语句对循环段进行众核优化,将循环段计算任务分发到不用的众核上;S5、对编译指示语句进行调优,通过多轮对比测试,作为最终的优化版本,可供模式其他算例使用。本发明在提升主核访存性能的同时,也有利于从核进行灵活的分块和合并等操作,还可以达到众核加速的效果。
-
公开(公告)号:CN114217935A
公开(公告)日:2022-03-22
申请号:CN202110209591.3
申请日:2021-02-25
Applicant: 无锡江南计算技术研究所
IPC: G06F9/50 , G06F17/18 , G06F12/0884
Abstract: 本发明公开一种解决耦合器插值计算的众核并行优化算法,包括以下步骤:S1、运行插值计算程序,并根据插值计算程序的运行结果获取插值计算中的核心代码;S2、针对S1中获取的核心代码,逐行进行分析,获取核心代码中作为输入输出变量的全局变量;S3、对S2中获取的全局变量,按照数据结构复杂度分为基础数据类型变量与复杂数据类型变量两类;S4、分析通过S3分类获得的每个复杂数据类型变量;S5、将通过S3分类获得的复杂数据类型变量进行数据结构优化;S6、使用按照上述步骤编写的代码替换插值计算程序中相对应的代码,重新进行程序的编译和运行。本发明能够大幅度减少从核的离散访存开销,极大程度的提高众核并行程序的运算速度,最终提高地球系统模式的性能。
-
公开(公告)号:CN109684061A
公开(公告)日:2019-04-26
申请号:CN201811583475.2
申请日:2018-12-24
Applicant: 无锡江南计算技术研究所
CPC classification number: G06F9/4881 , G06F9/5066 , G06F9/5083 , G06F2209/5018
Abstract: 本发明公开一种非结构网格众核粗粒度并行计算方法,该方法在第一级非结构网格的区域分解的基础上增加了第二级的线程级区域分解,每个从核求解各自的独立计算区域,保证从核核心计算任务的数据命中率,实现MPI进程级的粗粒度并行和从核线程级的粗粒度并行。本发明能够解决一般非结构网格应用在多态异构处理器上的适应性问题,根据非结构网格数据规模自动完成二级负载平衡和计算核心的粗粒度众核并行,提高了异构体系结构上非结构网格数值模拟的计算效率和并行效率。
-
公开(公告)号:CN105487815A
公开(公告)日:2016-04-13
申请号:CN201510828200.0
申请日:2015-11-24
Applicant: 无锡江南计算技术研究所
IPC: G06F3/06
CPC classification number: G06F3/0611 , G06F2003/0692
Abstract: 本发明提供了一种基于RDMA机制的并行输入输出方法。所述并行输入输出方法包括:客户端通过套接字端口向服务器发送输入输出操作信息;客户端通过InfiniBand端口向服务器传送输入输出操作数据;服务器根据接收到的输入输出操作信息和输入输出操作数据统一进行输入输出操作。
-
公开(公告)号:CN112559032B
公开(公告)日:2023-06-13
申请号:CN201910910103.4
申请日:2019-09-25
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种基于循环段的众核程序重构方法,包括基于循环段拆分的重构算法和基于循环段合并的重构算法,其中,所述基于循环段拆分的重构算法包括基于主从协同任务的循环段拆分和基于空间压缩的循环段拆分,所述基于循环段合并的重构算法包括基于相似结构的循环段合并和基于增加循环量的循环段合并。本发明根据异构系统的结构特点和性能指标,优化循环段的层次结构和顺序,充分发挥系统的性能优势,从而最大程序提高应用软件的计算性能。
-
-
-
-
-
-
-
-
-