-
公开(公告)号:CN112559032A
公开(公告)日:2021-03-26
申请号:CN201910910103.4
申请日:2019-09-25
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种基于循环段的众核程序重构方法,包括基于循环段拆分的重构算法和基于循环段合并的重构算法,其中,所述基于循环段拆分的重构算法包括基于主从协同任务的循环段拆分和基于空间压缩的循环段拆分,所述基于循环段合并的重构算法包括基于相似结构的循环段合并和基于增加循环量的循环段合并。本发明根据异构系统的结构特点和性能指标,优化循环段的层次结构和顺序,充分发挥系统的性能优势,从而最大程序提高应用软件的计算性能。
-
-
公开(公告)号:CN112446004B
公开(公告)日:2023-07-07
申请号:CN201910799250.9
申请日:2019-08-28
Applicant: 无锡江南计算技术研究所
IPC: G06F17/11
Abstract: 本发明公开一种非结构网格DILU预条件子众核并行优化方法,包括以下步骤:S1、对所有的从核进行编号,建立众核通信模型;S2、对wPtr数组进行分块、编号,各核按块拷入wPtr数据,同时按块拷入相应的rDPtr和lowerPtr;S3、依次确定各块的依赖关系;S4、根据依赖关系,第0块遍历计算一遍,将0号块的值全部更新,同时生成数据数组,发送至后面的块;S5、根据依赖关系,其余块接收来自前在先块的数据,遍历计算后,更新块内数据,同时生成数据数组,发送至后面的块;S6、当某一从核完成更新并将数据发送给需要的核之后,重新拷入新的块。本发明对科学计算领域常见的预条件子并行问题进行代码级优化,极大减少预处理时间,提高优化效率,对大规模线性方程组求解的性能提升效果更加显著。
-
公开(公告)号:CN114218737A
公开(公告)日:2022-03-22
申请号:CN202110481531.7
申请日:2021-04-30
Applicant: 无锡江南计算技术研究所
IPC: G06F30/20 , G06F15/16 , G06F111/10
Abstract: 本发明公开一种基于国产众核架构的POM海洋模式众核优化方法,S1、分析源码,确定循环层数和每层循环量大小,并通过将小循环合并为大循环或者判断外移的方法将源代码修改成更适合众核化的代码;S2、更改众核代码;S3、用魔方旋转算法化多维stencil计算的跨步访存为连续访存;S4、对于不存在跨步访存且各维循环之间无相关性的代码,运用多维循环合并方法提高并行效率;S5、修改众核代码并验证正确性。本发明在众核架构计算机上充分利用众核的优势,提升不同大小规模数据的计算效率。
-
公开(公告)号:CN112559031A
公开(公告)日:2021-03-26
申请号:CN201910910099.1
申请日:2019-09-25
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种基于数据结构的众核程序重构方法,包括基于提取基本类型数据结构的重构方法、基于数组降维的空间压缩的重构方法、基于增大传输字长的空间压缩的重构方法。本发明主要针对多级异构众核并行计算问题中多样化的数据结构,提供高效的数据结构重构方法,提高异构并行程序的计算效率。
-
公开(公告)号:CN112540718A
公开(公告)日:2021-03-23
申请号:CN201910898286.2
申请日:2019-09-23
Applicant: 无锡江南计算技术研究所
IPC: G06F3/06
Abstract: 本发明公开一种面向申威众核架构的稀疏矩阵存储方法,所述众核处理器由4个异构群构成,每个异构群包括一个主核、64个从核构成的从核簇、异构群接口和存储控制器,整芯片有260个计算核心;所述稀疏矩阵存储格式包括以下步骤:S1、将稀疏矩阵按行在申威众核处理器的核组阵列上分组,每个从核分到的若干行为一组,将64个从核分为64组;S2、对每组内的稀疏矩阵非零元素按列压缩存储,通过保存稀疏矩阵每列包含的非零元数量而对列坐标进行压缩,需要保存列索引、行坐标和非零元值,完成存储。本发明能够为应用软件基于众核处理器的全过程求解提供一种统一的数据组织形式,从而提高该类问题对申威众核架构适应性。
-
公开(公告)号:CN109656890A
公开(公告)日:2019-04-19
申请号:CN201811583516.8
申请日:2018-12-24
Applicant: 无锡江南计算技术研究所
IPC: G06F16/172 , G06F11/14
Abstract: 本发明公开一种安全快速的大规模并行计算输入输出实现方法,该方法建立双备份安全目录机制;采用断点文件的分层目录结构管理;根据底层网络带宽和计算节点主核数选择输出因子。本发明解决了超大规模断点文件的安全性问题,解决了超大规模断点文件的高效输出输入问题,是一种安全可靠、效率高的写断点文件方法,解决CFD领域大规模安全可靠的并行计算问题。
-
公开(公告)号:CN102929738B
公开(公告)日:2015-02-11
申请号:CN201210442295.9
申请日:2012-11-06
Applicant: 无锡江南计算技术研究所
IPC: G06F11/07
Abstract: 本发明提供了一种大规模异构并行计算的容错方法,包括:对每个时间步的每个核心计算模块,进行以下处理:将计算课题的计算数组的内容赋值给备份数组;完成核心计算模块的计算;其中,完成核心计算模块的计算包括:统计可用处理器核数,以获得第一处理器核数;可用处理器核并行运算核心计算模块;再次统计可用处理器核数,以获得第二处理器核数;比较第一处理器核数和第二处理器核数,若第二处理器核数小于第一处理器核数,则将备份数组的内容赋值给计算数组,并重新完成核心计算模块的计算,直至第一处理器核数与第二处理器核数一致。本发明的大规模异构并行计算容错方法能充分利用计算资源,减少故障恢复时间,提高并行计算的可靠性。
-
公开(公告)号:CN117992715A
公开(公告)日:2024-05-07
申请号:CN202410173432.6
申请日:2024-02-07
Applicant: 无锡江南计算技术研究所
Abstract: 本申请实施例公开了一种基于异构众核的对界融合批量浮点精度转换方法。该方法包括:将目标矩阵数据中同一预设维度的数据作为一个子矩阵数据;其中,预设维度为行或者列;根据所述子矩阵数据的数据量以及所述计算核心的局部存储空间,确定需要所述计算核心处理的目标子矩阵数据以及处理方式;通过所述计算核心基于所述处理方式对所述目标子矩阵数据进行处理。上述方案能够解决目前遍历目标矩阵数据进行精度转换过程中,数据访问量大、效率低的问题,从而通过异构众核结构对目标矩阵数据进行处理,提高同时处理的数据量,提高数据处理效率。
-
公开(公告)号:CN117332194A
公开(公告)日:2024-01-02
申请号:CN202311343967.5
申请日:2023-10-17
Applicant: 无锡江南计算技术研究所
Abstract: 本发明实施例公开了一种高阶龙格库塔法的混合精度处理方法、装置及设备。该方法包括:获取待处理业务对应的标准业务表达式;对标准业务表达式进行处理,得到目标业务表达式;确定目标业务表达式中的目标数据项;基于高阶Runge‑Kutta龙格库塔法,确定目标数据项的候选阶数;根据候选阶数,确定目标业务表达式的当前目标阶数;根据当前目标阶数,确定对应的目标精度格式;其中,目标精度格式基于混合精度格式确定;根据目标精度格式对目标业务表达式进行处理,得到业务结果。上述方案,实现了在考虑候选阶数的基础上,对目标业务表达式进行处理,提高了对目标业务表达式进行处理的准确度,减少了计算资源和能耗的浪费。
-
-
-
-
-
-
-
-
-