-
公开(公告)号:CN118227442A
公开(公告)日:2024-06-21
申请号:CN202410442884.X
申请日:2024-04-12
Applicant: 齐鲁工业大学(山东省科学院) , 山东省计算中心(国家超级计算济南中心)
Abstract: 本发明公开一种基于微架构参数的处理器性能模型构建方法及系统,涉及处理器性能建模技术领域,方法为:获取处理器运行作业时的微架构参数;将微架构参数中的作业运行时间作为因变量、硬件微观结构参数作为自变量、本地计算特征参数作为辅助变量,初步构建基于线性部分和非线性部分的性能模型;以自变量和辅助变量之间的相关性为权重改进线性部分,结合梯度下降法优化改进的线性部分;动态设定自变量的组合和幂次范围,并引入自变量的对数项,利用多项式特征转换,结合ElasticNetCV模型和粒子群优化算法,优化非线性部分;以此搭建最终的性能模型。本发明能够更好的量化作业运行性能,应对复杂的数据情况,精确预测作业运行时间。
-
公开(公告)号:CN110262900B
公开(公告)日:2023-09-29
申请号:CN201910536896.8
申请日:2019-06-20
Applicant: 山东省计算中心(国家超级计算济南中心)
Abstract: 本发明涉及一种基于申威众核处理器的主核与核组之间通信锁同步运行加速方法,包括步骤如下:A、判断程序段A、程序段B、程序段C之间的程序上下文依赖关系;如果程序段A、程序段B、程序段C三者之间都存在程序上下文依赖关系,则顺序执行;否则,调整程序段A、程序段B、程序段C之间的执行顺序,进行执行;B、对连续的后三段程序段执行步骤A直至执行完所有的程序。本发明判断程序段之间的程序上下文依赖关系,分情况灵活处理,还引入了“通信锁”同步机制,节省了主核等待时间,实现了主核和核组的并行处理,程序执行过程中,减少了对spawn和join核组线程的需要次数,提高了程序的执行效率。
-
公开(公告)号:CN109145255B
公开(公告)日:2022-03-29
申请号:CN201810593876.X
申请日:2018-06-11
Applicant: 山东省计算中心(国家超级计算济南中心)
IPC: G06F17/16
Abstract: 本发明涉及一种稀疏矩阵LU分解行更新的异构并行计算方法。本发明在superlu算法的基础上,结合太湖之光的主从异构特点,使superlu求解器在矩阵分解阶段,对行更新的过程中,将大规模计算任务转移至从核,利用从核组高效的计算和数据通信能力,提高超大规模稀疏矩阵的求解计算能力,进一步求解的整体性能。本发明按矩阵的数据进行任务划分的方式,对矩阵数据块按行进行划分,首先为每个从核开辟一个矩阵空间,每个从核负责几个矩阵行的求解,在求下三角单位矩阵类型的线性方程组的过程中,各行数据相互独立,避免求解空间发生冲突和依赖,顺利实现对方程组的求解。
-
公开(公告)号:CN108628727B
公开(公告)日:2021-06-01
申请号:CN201810353590.4
申请日:2018-04-19
Applicant: 山东省计算中心(国家超级计算济南中心)
Abstract: 本发明涉及一种基于模式运行时特征的模式作业运行状态分析方法,包括:(1)实时提取状态特征、量化特征;(2)根据状态特征判别模式作业运行状态;(3)根据量化特征分析模式作业性能是否发生异常。本发明基于定性信息的状态特征,通过对有限个状态的直接判断,可有效发现一定类别的故障,提高了故障发现的及时性。基于性能参数的量化特征,通过相关性分析、常态范围判别、固定周期预测、时间序列分析等技术,能够及时识别模式作业的运行异常,能够有效发现计算节点挂死、作业无输出、中间变量异常等目前存在的不便识别和判断的现象,有利于模式的业务连续性运行保障。
-
公开(公告)号:CN109145255A
公开(公告)日:2019-01-04
申请号:CN201810593876.X
申请日:2018-06-11
Applicant: 山东省计算中心(国家超级计算济南中心)
IPC: G06F17/16
CPC classification number: G06F17/16
Abstract: 本发明涉及一种稀疏矩阵LU分解行更新的异构并行计算方法。本发明在superlu算法的基础上,结合太湖之光的主从异构特点,使superlu求解器在矩阵分解阶段,对行更新的过程中,将大规模计算任务转移至从核,利用从核组高效的计算和数据通信能力,提高超大规模稀疏矩阵的求解计算能力,进一步求解的整体性能。本发明按矩阵的数据进行任务划分的方式,对矩阵数据块按行进行划分,首先为每个从核开辟一个矩阵空间,每个从核负责几个矩阵行的求解,在求下三角单位矩阵类型的线性方程组的过程中,各行数据相互独立,避免求解空间发生冲突和依赖,顺利实现对方程组的求解。
-
公开(公告)号:CN119576417A
公开(公告)日:2025-03-07
申请号:CN202411627592.X
申请日:2024-11-14
Applicant: 齐鲁工业大学(山东省科学院) , 山东省计算中心(国家超级计算济南中心)
IPC: G06F9/38
Abstract: 本发明提出了一种减少全局通信的预处理流水线共轭梯度算法优化方法,涉及高性能计算技术领域,包括:构建待求解的线性方程,并将其划分为多个子方程,用于并行求解;采用改进后的预处理流水线共轭梯度算法,对每个子方程进行迭代求解过程中,通过内积合并使得在每次迭代中仅执行一次全局归约操作,并将原本阻塞的全局归约函数替换为非阻塞的全局归约函数,使全局归约操作与矩阵向量乘法、边界更新操作和预处理操作重叠执行;对所有子方程的解进行组合,得到待预测位置的海平面高度;本发明对预处理流水线共轭梯度算法进行改进,通过减少全局归约操作并结合EVP预处理器进一步提升了并行性能,加速了POP2模型的模拟速度。
-
公开(公告)号:CN110222007B
公开(公告)日:2023-11-24
申请号:CN201910536855.9
申请日:2019-06-20
Applicant: 山东省计算中心(国家超级计算济南中心)
Abstract: 本发明涉及一种基于申威众核处理器的加速运行方法,包括:A、判断程序段A、程序段B、程序段C之间的程序上下文依赖关系;如果程序段A、程序段B、程序段C三者之间都存在程序上下文依赖关系,则顺序执行;否则,调整程序段A、程序段B、程序段C之间的执行顺序,进行执行;B、对连续的后三段程序段执行步骤A直至执行完所有的程序。本发明判断程序段以及程序子段之间的程序上下文依赖关系,分情况灵活处理,引入了通信锁同步机制,节省了主核等待时间,实现了主核和核组的并行处理,程序执行过程中,减少了对spawn和join核组线程的需要次数,提高了程序的执行效率。
-
公开(公告)号:CN113835984B
公开(公告)日:2023-08-08
申请号:CN202111135266.3
申请日:2021-09-27
Applicant: 山东省计算中心(国家超级计算济南中心)
IPC: G06F11/34
Abstract: 本发明公开了一种基于国产超算微架构的众核应用性能评估方法。本发明针对神威国产超级计算机系统Athread并行编程模式中,线程组任务分发和结束、数据传输、数据计算、从核同步与通信等主要流程,根据大量不同规模的实际算例运行数据,拟合出对应的时间运行模型,且误差在10%以内,能有效的评估众核应用程序的运行性能。
-
公开(公告)号:CN110262884B
公开(公告)日:2023-03-24
申请号:CN201910536853.X
申请日:2019-06-20
Applicant: 山东省计算中心(国家超级计算济南中心)
Abstract: 本发明涉及一种基于申威众核处理器的核组内多程序多数据流分区并行的运行方法,本发明根据不同程序段之间的依赖关系,将多个可并行优化程序段放入同一核组执行,在同一核组内部,可以选择同步或者异步执行多个程序段;根据同一程序段内不同程序子段之间的依赖关系,在同一核组内部,可以选择并行执行多个程序子段。此种方法可以减少核组spawn与join的次数,减少主核与核组之间DMA传输的次数,重复利用核组中的数据,从而提高程序的运行效率。
-
公开(公告)号:CN108632086B
公开(公告)日:2020-12-11
申请号:CN201810356611.8
申请日:2018-04-19
Applicant: 山东省计算中心(国家超级计算济南中心)
Abstract: 本发明涉及一种并行作业运行故障定位方法。该方法针对并行作业运行过程中出现的故障,首先列举了导致故障发生的所有原因,并对其进行分类、分级;然后,通过问题规模及其关联关系,建立故障定位分析方法,由上而下、逐层排查故障原因,缩小了故障的处理范围,有效解决了高性能计算系统中故障定位难度高且准确性差的问题。
-
-
-
-
-
-
-
-
-