基于微架构参数的处理器性能模型构建方法及系统

    公开(公告)号:CN118227442A

    公开(公告)日:2024-06-21

    申请号:CN202410442884.X

    申请日:2024-04-12

    Abstract: 本发明公开一种基于微架构参数的处理器性能模型构建方法及系统,涉及处理器性能建模技术领域,方法为:获取处理器运行作业时的微架构参数;将微架构参数中的作业运行时间作为因变量、硬件微观结构参数作为自变量、本地计算特征参数作为辅助变量,初步构建基于线性部分和非线性部分的性能模型;以自变量和辅助变量之间的相关性为权重改进线性部分,结合梯度下降法优化改进的线性部分;动态设定自变量的组合和幂次范围,并引入自变量的对数项,利用多项式特征转换,结合ElasticNetCV模型和粒子群优化算法,优化非线性部分;以此搭建最终的性能模型。本发明能够更好的量化作业运行性能,应对复杂的数据情况,精确预测作业运行时间。

    一种基于申威众核处理器的主核与核组之间通信锁同步运行加速方法

    公开(公告)号:CN110262900B

    公开(公告)日:2023-09-29

    申请号:CN201910536896.8

    申请日:2019-06-20

    Abstract: 本发明涉及一种基于申威众核处理器的主核与核组之间通信锁同步运行加速方法,包括步骤如下:A、判断程序段A、程序段B、程序段C之间的程序上下文依赖关系;如果程序段A、程序段B、程序段C三者之间都存在程序上下文依赖关系,则顺序执行;否则,调整程序段A、程序段B、程序段C之间的执行顺序,进行执行;B、对连续的后三段程序段执行步骤A直至执行完所有的程序。本发明判断程序段之间的程序上下文依赖关系,分情况灵活处理,还引入了“通信锁”同步机制,节省了主核等待时间,实现了主核和核组的并行处理,程序执行过程中,减少了对spawn和join核组线程的需要次数,提高了程序的执行效率。

    一种稀疏矩阵LU分解行更新的异构并行计算方法

    公开(公告)号:CN109145255B

    公开(公告)日:2022-03-29

    申请号:CN201810593876.X

    申请日:2018-06-11

    Abstract: 本发明涉及一种稀疏矩阵LU分解行更新的异构并行计算方法。本发明在superlu算法的基础上,结合太湖之光的主从异构特点,使superlu求解器在矩阵分解阶段,对行更新的过程中,将大规模计算任务转移至从核,利用从核组高效的计算和数据通信能力,提高超大规模稀疏矩阵的求解计算能力,进一步求解的整体性能。本发明按矩阵的数据进行任务划分的方式,对矩阵数据块按行进行划分,首先为每个从核开辟一个矩阵空间,每个从核负责几个矩阵行的求解,在求下三角单位矩阵类型的线性方程组的过程中,各行数据相互独立,避免求解空间发生冲突和依赖,顺利实现对方程组的求解。

    一种基于模式运行时特征的模式作业运行状态分析方法

    公开(公告)号:CN108628727B

    公开(公告)日:2021-06-01

    申请号:CN201810353590.4

    申请日:2018-04-19

    Abstract: 本发明涉及一种基于模式运行时特征的模式作业运行状态分析方法,包括:(1)实时提取状态特征、量化特征;(2)根据状态特征判别模式作业运行状态;(3)根据量化特征分析模式作业性能是否发生异常。本发明基于定性信息的状态特征,通过对有限个状态的直接判断,可有效发现一定类别的故障,提高了故障发现的及时性。基于性能参数的量化特征,通过相关性分析、常态范围判别、固定周期预测、时间序列分析等技术,能够及时识别模式作业的运行异常,能够有效发现计算节点挂死、作业无输出、中间变量异常等目前存在的不便识别和判断的现象,有利于模式的业务连续性运行保障。

    一种稀疏矩阵LU分解行更新的异构并行计算方法

    公开(公告)号:CN109145255A

    公开(公告)日:2019-01-04

    申请号:CN201810593876.X

    申请日:2018-06-11

    CPC classification number: G06F17/16

    Abstract: 本发明涉及一种稀疏矩阵LU分解行更新的异构并行计算方法。本发明在superlu算法的基础上,结合太湖之光的主从异构特点,使superlu求解器在矩阵分解阶段,对行更新的过程中,将大规模计算任务转移至从核,利用从核组高效的计算和数据通信能力,提高超大规模稀疏矩阵的求解计算能力,进一步求解的整体性能。本发明按矩阵的数据进行任务划分的方式,对矩阵数据块按行进行划分,首先为每个从核开辟一个矩阵空间,每个从核负责几个矩阵行的求解,在求下三角单位矩阵类型的线性方程组的过程中,各行数据相互独立,避免求解空间发生冲突和依赖,顺利实现对方程组的求解。

    一种减少全局通信的预处理流水线共轭梯度算法优化方法

    公开(公告)号:CN119576417A

    公开(公告)日:2025-03-07

    申请号:CN202411627592.X

    申请日:2024-11-14

    Abstract: 本发明提出了一种减少全局通信的预处理流水线共轭梯度算法优化方法,涉及高性能计算技术领域,包括:构建待求解的线性方程,并将其划分为多个子方程,用于并行求解;采用改进后的预处理流水线共轭梯度算法,对每个子方程进行迭代求解过程中,通过内积合并使得在每次迭代中仅执行一次全局归约操作,并将原本阻塞的全局归约函数替换为非阻塞的全局归约函数,使全局归约操作与矩阵向量乘法、边界更新操作和预处理操作重叠执行;对所有子方程的解进行组合,得到待预测位置的海平面高度;本发明对预处理流水线共轭梯度算法进行改进,通过减少全局归约操作并结合EVP预处理器进一步提升了并行性能,加速了POP2模型的模拟速度。

    一种基于申威众核处理器的加速运行方法

    公开(公告)号:CN110222007B

    公开(公告)日:2023-11-24

    申请号:CN201910536855.9

    申请日:2019-06-20

    Abstract: 本发明涉及一种基于申威众核处理器的加速运行方法,包括:A、判断程序段A、程序段B、程序段C之间的程序上下文依赖关系;如果程序段A、程序段B、程序段C三者之间都存在程序上下文依赖关系,则顺序执行;否则,调整程序段A、程序段B、程序段C之间的执行顺序,进行执行;B、对连续的后三段程序段执行步骤A直至执行完所有的程序。本发明判断程序段以及程序子段之间的程序上下文依赖关系,分情况灵活处理,引入了通信锁同步机制,节省了主核等待时间,实现了主核和核组的并行处理,程序执行过程中,减少了对spawn和join核组线程的需要次数,提高了程序的执行效率。

Patent Agency Ranking