非结构网格DILU预条件子众核并行优化方法

    公开(公告)号:CN112446004B

    公开(公告)日:2023-07-07

    申请号:CN201910799250.9

    申请日:2019-08-28

    Abstract: 本发明公开一种非结构网格DILU预条件子众核并行优化方法,包括以下步骤:S1、对所有的从核进行编号,建立众核通信模型;S2、对wPtr数组进行分块、编号,各核按块拷入wPtr数据,同时按块拷入相应的rDPtr和lowerPtr;S3、依次确定各块的依赖关系;S4、根据依赖关系,第0块遍历计算一遍,将0号块的值全部更新,同时生成数据数组,发送至后面的块;S5、根据依赖关系,其余块接收来自前在先块的数据,遍历计算后,更新块内数据,同时生成数据数组,发送至后面的块;S6、当某一从核完成更新并将数据发送给需要的核之后,重新拷入新的块。本发明对科学计算领域常见的预条件子并行问题进行代码级优化,极大减少预处理时间,提高优化效率,对大规模线性方程组求解的性能提升效果更加显著。

    面向申威众核架构的稀疏矩阵存储方法

    公开(公告)号:CN112540718A

    公开(公告)日:2021-03-23

    申请号:CN201910898286.2

    申请日:2019-09-23

    Abstract: 本发明公开一种面向申威众核架构的稀疏矩阵存储方法,所述众核处理器由4个异构群构成,每个异构群包括一个主核、64个从核构成的从核簇、异构群接口和存储控制器,整芯片有260个计算核心;所述稀疏矩阵存储格式包括以下步骤:S1、将稀疏矩阵按行在申威众核处理器的核组阵列上分组,每个从核分到的若干行为一组,将64个从核分为64组;S2、对每组内的稀疏矩阵非零元素按列压缩存储,通过保存稀疏矩阵每列包含的非零元数量而对列坐标进行压缩,需要保存列索引、行坐标和非零元值,完成存储。本发明能够为应用软件基于众核处理器的全过程求解提供一种统一的数据组织形式,从而提高该类问题对申威众核架构适应性。

    大规模异构并行计算的容错方法

    公开(公告)号:CN102929738B

    公开(公告)日:2015-02-11

    申请号:CN201210442295.9

    申请日:2012-11-06

    Abstract: 本发明提供了一种大规模异构并行计算的容错方法,包括:对每个时间步的每个核心计算模块,进行以下处理:将计算课题的计算数组的内容赋值给备份数组;完成核心计算模块的计算;其中,完成核心计算模块的计算包括:统计可用处理器核数,以获得第一处理器核数;可用处理器核并行运算核心计算模块;再次统计可用处理器核数,以获得第二处理器核数;比较第一处理器核数和第二处理器核数,若第二处理器核数小于第一处理器核数,则将备份数组的内容赋值给计算数组,并重新完成核心计算模块的计算,直至第一处理器核数与第二处理器核数一致。本发明的大规模异构并行计算容错方法能充分利用计算资源,减少故障恢复时间,提高并行计算的可靠性。

    一种基于异构众核的对界融合批量浮点精度转换方法

    公开(公告)号:CN117992715A

    公开(公告)日:2024-05-07

    申请号:CN202410173432.6

    申请日:2024-02-07

    Abstract: 本申请实施例公开了一种基于异构众核的对界融合批量浮点精度转换方法。该方法包括:将目标矩阵数据中同一预设维度的数据作为一个子矩阵数据;其中,预设维度为行或者列;根据所述子矩阵数据的数据量以及所述计算核心的局部存储空间,确定需要所述计算核心处理的目标子矩阵数据以及处理方式;通过所述计算核心基于所述处理方式对所述目标子矩阵数据进行处理。上述方案能够解决目前遍历目标矩阵数据进行精度转换过程中,数据访问量大、效率低的问题,从而通过异构众核结构对目标矩阵数据进行处理,提高同时处理的数据量,提高数据处理效率。

    高阶龙格库塔法的混合精度处理方法、装置及设备

    公开(公告)号:CN117332194A

    公开(公告)日:2024-01-02

    申请号:CN202311343967.5

    申请日:2023-10-17

    Abstract: 本发明实施例公开了一种高阶龙格库塔法的混合精度处理方法、装置及设备。该方法包括:获取待处理业务对应的标准业务表达式;对标准业务表达式进行处理,得到目标业务表达式;确定目标业务表达式中的目标数据项;基于高阶Runge‑Kutta龙格库塔法,确定目标数据项的候选阶数;根据候选阶数,确定目标业务表达式的当前目标阶数;根据当前目标阶数,确定对应的目标精度格式;其中,目标精度格式基于混合精度格式确定;根据目标精度格式对目标业务表达式进行处理,得到业务结果。上述方案,实现了在考虑候选阶数的基础上,对目标业务表达式进行处理,提高了对目标业务表达式进行处理的准确度,减少了计算资源和能耗的浪费。

Patent Agency Ranking