具有多重条件判别的循环优化方法

    公开(公告)号:CN112560163A

    公开(公告)日:2021-03-26

    申请号:CN201910910098.7

    申请日:2019-09-25

    Abstract: 本发明公开一种具有多重条件判别的循环优化方法,包括以下步骤:S1、分析程序运行时的时间热点函数,找出时间热点函数中一个或多个耗时程序段;S2、若S1中找到的循环段为多重条件判别的循环段,执行下一步;S3、开始第一重循环;S4、开始第二重循环;S5、重复类似S3或S4过程;S6、判断最内层循环条件的逻辑值:若为“真”,进行原方法的核心计算、执行S6,若为“假”,直接开始最内层循环的下一个值计算;S7、重复步骤S6,完成最内层循环计算;S8、依据步骤S7的处理方法,依次完成S5、S4、S3步骤相应的循环,完成整个多重循环段的计算。本发明使大规模并行计算的性能有显著提升,提高相关问题的求解效率,从而提高整个应用系统的计算运行效率,对实际工程课题的数值模拟有重要意义。

    一种数值预报产品实时处理方法

    公开(公告)号:CN105678060A

    公开(公告)日:2016-06-15

    申请号:CN201511027453.4

    申请日:2015-12-31

    CPC classification number: G06F19/00 G06Q10/04

    Abstract: 一种数值预报产品实时处理方法,包括:使用数值预报系统计算预报数据,数值预报系统将每次计算的预报数据保存在文件系统中;采用预报产品生产服务进程,以服务运行方式,读取数值预报系统计算的预报数据,实时判断数值预报系统计算的预报数据是否加入了新数据,在加入了新数据的情况下,从文件系统中读入新数据进行更新;实时接收预报产品发布服务进程发送的针对预报区域内使用经纬度坐标确定的任意点的预报数据请求;响应于接收的针对该任意点的预报数据请求,对数值预报系统计算的预报数据进行实时处理,通过预定算法生成发布服务进程请求的预报区域内使用经纬度坐标确定的任意点的预报产品,将该任意点的预报产品返回给预报产品发布服务进程。

    大规模异构并行计算的容错方法

    公开(公告)号:CN102929738A

    公开(公告)日:2013-02-13

    申请号:CN201210442295.9

    申请日:2012-11-06

    Abstract: 本发明提供了一种大规模异构并行计算的容错方法,包括:对每个时间步的每个核心计算模块,进行以下处理:将计算课题的计算数组的内容赋值给备份数组;完成核心计算模块的计算;其中,完成核心计算模块的计算包括:统计可用处理器核数,以获得第一处理器核数;可用处理器核并行运算核心计算模块;再次统计可用处理器核数,以获得第二处理器核数;比较第一处理器核数和第二处理器核数,若第二处理器核数小于第一处理器核数,则将备份数组的内容赋值给计算数组,并重新完成核心计算模块的计算,直至第一处理器核数与第二处理器核数一致。本发明的大规模异构并行计算容错方法能充分利用计算资源,减少故障恢复时间,提高并行计算的可靠性。

    面向申威众核架构的稀疏矩阵存储方法

    公开(公告)号:CN112540718A

    公开(公告)日:2021-03-23

    申请号:CN201910898286.2

    申请日:2019-09-23

    Abstract: 本发明公开一种面向申威众核架构的稀疏矩阵存储方法,所述众核处理器由4个异构群构成,每个异构群包括一个主核、64个从核构成的从核簇、异构群接口和存储控制器,整芯片有260个计算核心;所述稀疏矩阵存储格式包括以下步骤:S1、将稀疏矩阵按行在申威众核处理器的核组阵列上分组,每个从核分到的若干行为一组,将64个从核分为64组;S2、对每组内的稀疏矩阵非零元素按列压缩存储,通过保存稀疏矩阵每列包含的非零元数量而对列坐标进行压缩,需要保存列索引、行坐标和非零元值,完成存储。本发明能够为应用软件基于众核处理器的全过程求解提供一种统一的数据组织形式,从而提高该类问题对申威众核架构适应性。

    大规模异构并行计算的容错方法

    公开(公告)号:CN102929738B

    公开(公告)日:2015-02-11

    申请号:CN201210442295.9

    申请日:2012-11-06

    Abstract: 本发明提供了一种大规模异构并行计算的容错方法,包括:对每个时间步的每个核心计算模块,进行以下处理:将计算课题的计算数组的内容赋值给备份数组;完成核心计算模块的计算;其中,完成核心计算模块的计算包括:统计可用处理器核数,以获得第一处理器核数;可用处理器核并行运算核心计算模块;再次统计可用处理器核数,以获得第二处理器核数;比较第一处理器核数和第二处理器核数,若第二处理器核数小于第一处理器核数,则将备份数组的内容赋值给计算数组,并重新完成核心计算模块的计算,直至第一处理器核数与第二处理器核数一致。本发明的大规模异构并行计算容错方法能充分利用计算资源,减少故障恢复时间,提高并行计算的可靠性。

    基于序列分层的异构众核快速傅里叶变换方法

    公开(公告)号:CN112559952B

    公开(公告)日:2023-07-07

    申请号:CN201910918627.8

    申请日:2019-09-26

    Abstract: 本发明公开一种基于序列分层的异构众核快速傅里叶变换方法,包括以下步骤:S1、将待转序列按FFT运算层序进行分块,分块大小为当前运算层一次基本运算的子序列大小,即第1次分块时,每个分块的大小为2,即将输入序列分成大小为2的若干个小块;第2次分块时,每个分块的大小为4,即将输入序列分成大小为4的若干个小块;以此类推,第n次分块时,每个分块的大小为2n,即将输入序列分成大小为2n的若干个小块;一直分到每个分块的大小与输入序列的长度相同为止;S2、将每一层的分块并行地利用异构众核架构进行加速运算,通过片上网络实现分块内部的众核加速。本发明提高大规模数据的FFT算法性能。

    一种高效大气模式物理过程任务划分算法

    公开(公告)号:CN114217936A

    公开(公告)日:2022-03-22

    申请号:CN202110209594.7

    申请日:2021-02-25

    Abstract: 本发明公开一种高效大气模式物理过程任务划分算法,包括以下步骤:S1、获取大气模式中各进程所在的超节点编号;S2、根据S1中获取的超节点编号信息,对大气模式中的各进程进行分组,将具有相同超节点编号的进程分到同一个组;S3、第一级任务划分,采用与动力框架采用相同的网格划分方式,保证同一组进程中大气模式动力框架与物理过程具有相同的网格;S4、第二级任务划分,调整大气模式物理过程中组内进程间网格划分,将网格重分配到组内进程中。本发明既能使大气模式物理过程计算任务相对平衡,又能减少大气模式与动力框架耦合时的通信开销,可显著提高大气模式大规模并行时的整体性能。

Patent Agency Ranking