-
公开(公告)号:CN112560163A
公开(公告)日:2021-03-26
申请号:CN201910910098.7
申请日:2019-09-25
Applicant: 无锡江南计算技术研究所
IPC: G06F30/15 , G06F30/28 , G06F30/25 , G06F30/23 , G06F111/08 , G06F111/10 , G06F113/08 , G06F119/14
Abstract: 本发明公开一种具有多重条件判别的循环优化方法,包括以下步骤:S1、分析程序运行时的时间热点函数,找出时间热点函数中一个或多个耗时程序段;S2、若S1中找到的循环段为多重条件判别的循环段,执行下一步;S3、开始第一重循环;S4、开始第二重循环;S5、重复类似S3或S4过程;S6、判断最内层循环条件的逻辑值:若为“真”,进行原方法的核心计算、执行S6,若为“假”,直接开始最内层循环的下一个值计算;S7、重复步骤S6,完成最内层循环计算;S8、依据步骤S7的处理方法,依次完成S5、S4、S3步骤相应的循环,完成整个多重循环段的计算。本发明使大规模并行计算的性能有显著提升,提高相关问题的求解效率,从而提高整个应用系统的计算运行效率,对实际工程课题的数值模拟有重要意义。
-
公开(公告)号:CN112445603A
公开(公告)日:2021-03-05
申请号:CN201910799247.7
申请日:2019-08-28
Applicant: 无锡江南计算技术研究所
IPC: G06F9/50
Abstract: 本发明公开一种非结构网格主从动态并行预处理方法,基于由多个物理块构成的千万及以上量级规模的网格,包括以下步骤:S1、主进程按照物理块顺序分配任务,将每个物理块的网格信息分发至各从进程;S2、从进程接收来自主进程的任务,并对每个物理块内的网格单元进行预处理;S3、从进程将预处理结果发回至主进程,并向主进程申请下一组网格进行预处理;S4、主进程将所有网格组分发完后,向从进程发送结束信号;S5、从进程收到结束信号后,从进程结束。本发明能满足千万及以上量级网格规模的数值模拟需求,解决大规模非结构网格预处理内存需求过大和效率低的问题。
-
公开(公告)号:CN117992715A
公开(公告)日:2024-05-07
申请号:CN202410173432.6
申请日:2024-02-07
Applicant: 无锡江南计算技术研究所
Abstract: 本申请实施例公开了一种基于异构众核的对界融合批量浮点精度转换方法。该方法包括:将目标矩阵数据中同一预设维度的数据作为一个子矩阵数据;其中,预设维度为行或者列;根据所述子矩阵数据的数据量以及所述计算核心的局部存储空间,确定需要所述计算核心处理的目标子矩阵数据以及处理方式;通过所述计算核心基于所述处理方式对所述目标子矩阵数据进行处理。上述方案能够解决目前遍历目标矩阵数据进行精度转换过程中,数据访问量大、效率低的问题,从而通过异构众核结构对目标矩阵数据进行处理,提高同时处理的数据量,提高数据处理效率。
-
公开(公告)号:CN117332194A
公开(公告)日:2024-01-02
申请号:CN202311343967.5
申请日:2023-10-17
Applicant: 无锡江南计算技术研究所
Abstract: 本发明实施例公开了一种高阶龙格库塔法的混合精度处理方法、装置及设备。该方法包括:获取待处理业务对应的标准业务表达式;对标准业务表达式进行处理,得到目标业务表达式;确定目标业务表达式中的目标数据项;基于高阶Runge‑Kutta龙格库塔法,确定目标数据项的候选阶数;根据候选阶数,确定目标业务表达式的当前目标阶数;根据当前目标阶数,确定对应的目标精度格式;其中,目标精度格式基于混合精度格式确定;根据目标精度格式对目标业务表达式进行处理,得到业务结果。上述方案,实现了在考虑候选阶数的基础上,对目标业务表达式进行处理,提高了对目标业务表达式进行处理的准确度,减少了计算资源和能耗的浪费。
-
公开(公告)号:CN112446004A
公开(公告)日:2021-03-05
申请号:CN201910799250.9
申请日:2019-08-28
Applicant: 无锡江南计算技术研究所
IPC: G06F17/11
Abstract: 本发明公开一种非结构网格DILU预条件子众核并行优化算法,包括以下步骤:S1、对所有的从核进行编号,建立众核通信模型;S2、对数组进行分块、编号,各核按块拷入数据,同时按块拷入相应的和;S3、依次确定各块的依赖关系;S4、根据依赖关系,第0块遍历计算一遍,将0号块的值全部更新,同时生成数据数组,发送至后面的块;S5、根据依赖关系,其余块接收来自前在先块的数据,遍历计算后,更新块内数据,同时生成数据数组,发送至后面的块;S6、当某一从核完成更新并将数据发送给需要的核之后,重新拷入新的块。本发明对科学计算领域常见的预条件子并行问题进行代码级优化,极大减少预处理时间,提高优化效率,对大规模线性方程组求解的性能提升效果更加显著。
-
公开(公告)号:CN114217936A
公开(公告)日:2022-03-22
申请号:CN202110209594.7
申请日:2021-02-25
Applicant: 无锡江南计算技术研究所
IPC: G06F9/50
Abstract: 本发明公开一种高效大气模式物理过程任务划分算法,包括以下步骤:S1、获取大气模式中各进程所在的超节点编号;S2、根据S1中获取的超节点编号信息,对大气模式中的各进程进行分组,将具有相同超节点编号的进程分到同一个组;S3、第一级任务划分,采用与动力框架采用相同的网格划分方式,保证同一组进程中大气模式动力框架与物理过程具有相同的网格;S4、第二级任务划分,调整大气模式物理过程中组内进程间网格划分,将网格重分配到组内进程中。本发明既能使大气模式物理过程计算任务相对平衡,又能减少大气模式与动力框架耦合时的通信开销,可显著提高大气模式大规模并行时的整体性能。
-
公开(公告)号:CN112559032A
公开(公告)日:2021-03-26
申请号:CN201910910103.4
申请日:2019-09-25
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种基于循环段的众核程序重构方法,包括基于循环段拆分的重构算法和基于循环段合并的重构算法,其中,所述基于循环段拆分的重构算法包括基于主从协同任务的循环段拆分和基于空间压缩的循环段拆分,所述基于循环段合并的重构算法包括基于相似结构的循环段合并和基于增加循环量的循环段合并。本发明根据异构系统的结构特点和性能指标,优化循环段的层次结构和顺序,充分发挥系统的性能优势,从而最大程序提高应用软件的计算性能。
-
-
-
-
-
-