一种应用于并行科学计算程序的函数运行时间测量方法

    公开(公告)号:CN112882912B

    公开(公告)日:2022-10-25

    申请号:CN202110141179.2

    申请日:2021-02-01

    Abstract: 本发明提供了一种应用于并行科学计算程序的函数运行时间测量方法,包括以下步骤:通过LLVM,对待测量程序源文件生成中间文件,并进行扫描,获取所有自定义函数名,并进行编号,并写入函数名记录文件;生成新中间文件;针对新的中间文件,生成待测量程序的可执行文件;计时函数记录并确定函数之间的父子调用关系和调用次数,记录函数的运行时间;在待测量程序的可执行文件运行结束后,得到计时结果文件;根据计时结果文件,整理计时结果文件,产生新的计时结果文件;将新的计时结果文件中的函数编号还原成函数名。本发明提供了一种应用于并行科学计算程序的函数运行时间测量方法,可以得到精确的函数运行时间,有助于挖掘程序的性能瓶颈。

    一种应用于并行科学计算程序的细粒度性能建模方法

    公开(公告)号:CN112784422B

    公开(公告)日:2022-10-25

    申请号:CN202110115720.2

    申请日:2021-01-28

    Abstract: 本发明公开了一种应用于并行科学计算程序的细粒度性能建模方法,其具体步骤如下:获取程序所有的自定义函数名和MPI通信函数名,以及程序在一系列并行度下,各个自定义函数自身的计算时间和MPI通信函数的通信时间;逐一对自定义函数和MPI通信函数选择不同类型的基函数,进行拟合得到该函数的性能模型;将所有建模结果聚合,得到程序整体的性能模型。本发明的一种应用于并行科学计算程序的细粒度性能建模方法,专注于研究程序进程数量分配对程序运行时间的影响,对自定义函数和MPI通信函数分别建模,MPI通信函数又分为四类使用不同的基函数进行建模,然后再将建模结果进一步聚合,从而得到程序的整体模型,使得性能建模粒度更小,建模效果更好。

    一种应用于并行科学计算程序的函数运行时间测量方法

    公开(公告)号:CN112882912A

    公开(公告)日:2021-06-01

    申请号:CN202110141179.2

    申请日:2021-02-01

    Abstract: 本发明提供了一种应用于并行科学计算程序的函数运行时间测量方法,包括以下步骤:通过LLVM,对待测量程序源文件生成中间文件,并进行扫描,获取所有自定义函数名,并进行编号,并写入函数名记录文件;生成新中间文件;针对新的中间文件,生成待测量程序的可执行文件;计时函数记录并确定函数之间的父子调用关系和调用次数,记录函数的运行时间;在待测量程序的可执行文件运行结束后,得到计时结果文件;根据计时结果文件,整理计时结果文件,产生新的计时结果文件;将新的计时结果文件中的函数编号还原成函数名。本发明提供了一种应用于并行科学计算程序的函数运行时间测量方法,可以得到精确的函数运行时间,有助于挖掘程序的性能瓶颈。

    一种应用于并行科学计算程序的细粒度性能建模方法

    公开(公告)号:CN112784422A

    公开(公告)日:2021-05-11

    申请号:CN202110115720.2

    申请日:2021-01-28

    Abstract: 本发明公开了一种应用于并行科学计算程序的细粒度性能建模方法,其具体步骤如下:获取程序所有的自定义函数名和MPI通信函数名,以及程序在一系列并行度下,各个自定义函数自身的计算时间和MPI通信函数的通信时间;逐一对自定义函数和MPI通信函数选择不同类型的基函数,进行拟合得到该函数的性能模型;将所有建模结果聚合,得到程序整体的性能模型。本发明的一种应用于并行科学计算程序的细粒度性能建模方法,专注于研究程序进程数量分配对程序运行时间的影响,对自定义函数和MPI通信函数分别建模,MPI通信函数又分为四类使用不同的基函数进行建模,然后再将建模结果进一步聚合,从而得到程序的整体模型,使得性能建模粒度更小,建模效果更好。

    一种应用于大规模耦合程序的组件布局自动生成方法

    公开(公告)号:CN118069123A

    公开(公告)日:2024-05-24

    申请号:CN202410186337.X

    申请日:2024-02-20

    Abstract: 本发明公开了一种应用于大规模耦合程序的组件布局自动生成方法,其具体步骤如下:对所有可能的组合进行二进制编码并计算其编码值;选择编码值最大的组合作为根组合,并将该编码值最大的组合转化为布局形式写入布局文件;将根组合的编码值减1,生成组合标记列表,并将根组合赋值给当前组合;通过组合不可用性判定,识别因当前组合的加入而不可用的组合,在组合标记列表中将其标为不可用,生成历史版本记录,并将当前组合加入当前布局;将当前组合的编码值减1,判断当前组合的编码值是否等于0,若不为0则进入搜索过程,若为0则进入回溯过程,直至用根组合遍历完所有编码以1开头的组合,此时所有布局获取完毕,布局文件即为所求结果。

    基于遗传算法的最美路径导航算法

    公开(公告)号:CN104866903B

    公开(公告)日:2016-09-14

    申请号:CN201510249511.1

    申请日:2015-05-15

    Inventor: 刘垚 张恺 吴萍

    Abstract: 本发明公开了一种基于遗传算法的最美路径导航算法,它采用序号编码的形式,对每个景点进行编号,路线以经过景点的编号来表示,便于编码和解码,并采用线性聚合优先权法处理多目标遗传算法(MOGA),设计由自适应概率控制的插入、删除和变异算子处理变长染色体遗传算法(Clv GA),添加排序算子缩小搜索空间,加快收敛。本发明能够达到原始设计要求,取得相应的有效解,良好的解决了获取最美路径的问题。并且用户可指定计算参数,在获得的解集中选取自身喜爱的路径。

    一种EPS系统中PCC规则的调度方法

    公开(公告)号:CN103957168A

    公开(公告)日:2014-07-30

    申请号:CN201410148678.4

    申请日:2014-04-15

    Abstract: 本发明公开了一种EPS系统中PCC规则的调度方法,该方法包括:当UE提出IP-CAN会话请求时,PCEF根据TDF实体的探测结果决定是否激活PCRF未知的预定义的PCC规则,如果不激活,则请求PCRF制定PCC规则。PCRF根据TDF或AF等实体提供的相关信息,首先决定是否激活PCRF已知的预定义的PCC规则,如果不激活,则制定并下发动态的PCC规则,同时计算相关PCC规则的优先级。PCEF收到PCRF下发的PCC规则后,根据PCC规则优先级,激活相应的静态PCC规则,或者建立并使用动态PCC规则。针对IMS业务和非IMS业务在PCC架构中请求PCC规则,本发明减少交互信令的数量,降低通信系统的处理负担,增强PCC架构的鲁棒性。

    一种基于新一代国产众核处理器的自适应SpMV方法

    公开(公告)号:CN119829511A

    公开(公告)日:2025-04-15

    申请号:CN202411890391.9

    申请日:2024-12-20

    Abstract: 本发明公开了一种基于新一代国产众核处理器的自适应SpMV方法,包括以下步骤:设置启动参数;获取SpMV参数;设置并装载主存中输入向量x到共享LDM中向量sx;设置私有LDM局存空间;划分SpMV行块负载;若有剩余行块待处理,则从核取行块,否则退出;装载行块行偏移向量dptr并初始化行块输出向量dy;SpMV自适应决策;批量计算行块内剩余部分,若行块启用共享LDM标志位为真,则采用基于共享LDM的批量SpMV方法处理,否则使用基于硬件DCache的批量SpMV方法处理;返回继续取行块处理,直到无剩余行块待处理时结束。本发明提供了一种基于新一代国产众核处理器的自适应SpMV方法,实现细粒度自适应、充分发挥SW26010P架构特性优化访存,以最终提升SpMV计算性能。

Patent Agency Ranking