-
公开(公告)号:CN107273094A
公开(公告)日:2017-10-20
申请号:CN201710353362.2
申请日:2017-05-18
Applicant: 中国科学院软件研究所 , 无锡江南计算技术研究所
Abstract: 本发明公开了一种适应于“神威·太湖之光”上HPCG优化的数据结构及其高效实现方法,基于“神威·太湖之光”上的申威众核处理器体系结构特征和HPCG算法优化的需要,使用了改进ELL格式的数据结构对原始数据结构进行替换,除了包含矩阵数据本身的数据结构,还支持分块着色,索引转换,进程通信,以及向量位置映射等相关的数据结构,并且中间处理过程采用了申威众核平台提供的Athread多线程库进行并行,最终应用于HPCG算法的核心函数SpMV和SymGS优化过程中,相应的性能和带宽百分比取得了一致性的加速比,最高分别为18.2和17.6。
-
公开(公告)号:CN104699449B
公开(公告)日:2017-09-29
申请号:CN201510156109.9
申请日:2015-04-03
Applicant: 中国科学院软件研究所
IPC: G06F7/50
Abstract: 本发明涉及一种基于GMP的大整数加法和减法多核并行化实现方法,首先借助于临时数组来解决加法或减法操作产生的进位或借位带来的数据相关性问题,然后采用将迭代循环for中的运算进行任务划分,基于OpenMP多线程编程实现,使用动态调度策略,多线程并行求取各区域的计算任务的策略解决负载不均衡问题。本发明能借助多核平台,通过充分利用多核条件提高运行速度,在实际应用中有着十分重要的作用。
-
公开(公告)号:CN104793922A
公开(公告)日:2015-07-22
申请号:CN201510220528.4
申请日:2015-05-04
Applicant: 中国科学院软件研究所
Abstract: 本发明公开了一种大整数乘法Comba算法基于OpenMP的并行实现方法,基于64位无符号长整型整数操作,通过添加三个临时数组存储加乘操作计算得到的中间结果,从而解决加乘运算与进位运算的数据相关性,将加乘操作与进位操作分开执行。在加乘操作阶段,基于中间结果每个数位求取时的计算独立性,通过OpenMP多线程编程采用动态调度策略实现加乘操作阶段的并行化,而进位阶段仍然串行执行来并行化Comba算法,提高算法效率。
-
公开(公告)号:CN104182209A
公开(公告)日:2014-12-03
申请号:CN201410427589.3
申请日:2014-08-27
Applicant: 中国科学院软件研究所
IPC: G06F9/38
Abstract: 本发明公开一种基于PETSc的GCRO-DR算法并行处理方法,(1)并行进行m步Arnoldi迭代,生成子空间Vm+1和hessenberg矩阵(2)串行求解最小二乘问题特征值问题和Reduced QR分解;(3)开始进行迭代,并行进行m-k步Arnoldi过程;(4)并行求解(5)串行求解最小二乘问题和Reduced QR分解;(6)进行下一个迭代步,直至收敛;(7)当求解第二个及以后的系统时,先并行更新回收矩阵Ck和Uk,然后开始迭代,直至收敛。本发明提出的并行实现方法通过调用PETSc库能实现多个节点协同计算,进而可以提高GCRO-DR算法的整体性能。
-
-
-