一种基于程序性能计数的异常进程快速定位方法

    公开(公告)号:CN114238067A

    公开(公告)日:2022-03-25

    申请号:CN202110480190.1

    申请日:2021-04-30

    Abstract: 本发明公开一种基于程序性能计数的异常进程快速定位方法,包括以下步骤:S1、用户提交应用作业;S2、作业调度器在启动应用作业的同时,在每个任务对应的处理器上初始化预设的硬件性能计数器;S3、若程序正常执行直至结束,则基于性能计数器实现的性能计数不对程序产生干扰;S4、若程序执行错误,则启动错误定位处理流程;S45、报告异常任务,用于进一步展开精确的错误原因定位。本发明有效提高了开发人员的调试开发效率、提升了系统资源利用率。

    面向异构众核处理器的低扰动性能数据采集方法

    公开(公告)号:CN112445547A

    公开(公告)日:2021-03-05

    申请号:CN201910822171.5

    申请日:2019-09-02

    Abstract: 本发明公开一种面向异构众核处理器的低扰动性能数据采集方法,用于国产众核处理器,包括以下步骤:S1、在主核设置需要采集的性能数据所对应的性能事件,并对性能事件进行分类;S2、通过CSR寄存器设置硬件计数器的初值、计数使能控制、计数事件的选择,即将性能事件选择为计数事件,以实现对硬件计数器的初始化;S3、用户对需要进行性能数据采集的程序段进行插装,通过计算获得该程序段触发该性能事件的次数为两次统计接口函数的差值;S4、主核通过读取保存在统计接口参数地址中的性能事件的计数值实现性能数据的采集。本发明可以对多类性能事件进行并行采集,大大提高了数据采集效率,实现了高效全面、对程序低扰动的性能数据采集。

    一种异构众核程序动态调用树分析装置及分析方法

    公开(公告)号:CN114217812B

    公开(公告)日:2025-05-20

    申请号:CN202110479676.3

    申请日:2021-04-30

    Abstract: 本发明公开一种异构众核程序动态调用树分析装置及分析方法,所述分析方法包括以下步骤:S1、增加一个编译选项;S2、使用新增加的编译选项编译程序;S3、运行S2中生成的程序;S4、程序运行至InitFunc时,InitFunc进行空间申请,并将运算控制核和运算的L值均初始化为‑1。S5、程序运行至EnterFunc时,L值加1,检查D(L,PC,CPC)在STACKPC中是否存在,若存在,则过滤掉该记录的记录;S6、程序运行至LeaveFunc时,L值减1,若L值等于‑1,则进行输出操作,输出记录至文件;S7、调用结果展示模块进行展示。本发明能有效弥补静态分析的不足,提升代码逻辑分析效率。

    大规模并行程序用实时监测与分析方法

    公开(公告)号:CN112540900B

    公开(公告)日:2022-11-25

    申请号:CN201910892876.4

    申请日:2019-09-20

    Abstract: 本发明公开了一种大规模并行程序用实时监测与分析方法,S1:选出m个能够反映程序运行状态的性能指标;S2:采集选出的运行状态指标数据;S3:将S2中同一个进程相邻n次采集得到的指标数据组成一个纵向向量,计算不同进程间同一指标的余弦相似度;S4:根根据步骤S3对问题进程的其余指标进行计算,如果根据所有剩余指标得出的计算值也判断出该进程为问题进程,则判断该问题进程为异常进程,如果一个或多个指标的计算结果未超出阈值,则判断该问题进程为可疑进程;S5:将S3和S4中得到的正常进程、可疑进程和异常进程输出至显示屏。本发明在实现并行应用程序监测和分析的同时,能够降低对应用程序造成的开销和干扰。

    一种针对百量子级方形量子网格随机电路模拟方法

    公开(公告)号:CN114218881A

    公开(公告)日:2022-03-22

    申请号:CN202110481466.8

    申请日:2021-04-30

    Abstract: 本发明公开一种针对百量子级方形量子网格随机电路模拟方法,在利用张量网络方法对量子随机电路进行模拟的过程中,于是将张量网络切割成较小的张量片,存在不同的节点上;包括以下步骤:S1、将张量网络沿中线切割m次,以降低张量收缩路径中产生的最大张量片的阶数;S2、沿张量网络中线每切割1次,生成2^(L/8)个,独立的并行任务,将这些独立的任务分在不同的进程上并行计算,每个任务通过计算,得到一个标量结果,其中,L表示电路的层数;S3、将S2中获得的每个任务得到的标量结果相加,得到了张量的单振幅模拟结果。本发明可以降低模拟过程的内存需要,从而满足百量子比特以上量级量子随机电路的模拟需求。

    一种基于时空特性数据的调试调优方法

    公开(公告)号:CN114218066A

    公开(公告)日:2022-03-22

    申请号:CN202110480188.4

    申请日:2021-04-30

    Abstract: 本发明公开一种基于时空特性数据的调试调优方法,包括以下步骤:S1、采样控制模块配置所需采集的指标并启动采集;S2、性能指标采集模块采集性能指标,通过时间采集模块、空间采集模块分别采集当前性能指标所处的时间和代码空间,其中时间指标通常用处理器周期数表示,空间指标通常用程序的PC值表示;S3、在被监测代码运行结束时,通过采样控制模块结束采集并生成时空特性数据;S4、调用调优模块分析S3中生成的时空特性数据,分析出被监测代码的性能情况;S5、调用调试模块分析S3中生成的时空特性数据,分析程序是否存异常进程。本发明可以同时实现性能监测与程序调试,使用户在程序调优阶段能够快速定位优化导致的程序错误。

    大规模并行程序用实时监测与分析方法

    公开(公告)号:CN112540900A

    公开(公告)日:2021-03-23

    申请号:CN201910892876.4

    申请日:2019-09-20

    Abstract: 本发明公开了一种大规模并行程序用实时监测与分析方法,S1:选出m个能够反映程序运行状态的性能指标;S2:采集选出的运行状态指标数据;S3:将S2中同一个进程相邻n次采集得到的指标数据组成一个纵向向量,计算不同进程间同一指标的余弦相似度;S4:根根据步骤S3对问题进程的其余指标进行计算,如果根据所有剩余指标得出的计算值也判断出该进程为问题进程,则判断该问题进程为异常进程,如果一个或多个指标的计算结果未超出阈值,则判断该问题进程为可疑进程;S5:将S3和S4中得到的正常进程、可疑进程和异常进程输出至显示屏。本发明在实现并行应用程序监测和分析的同时,能够降低对应用程序造成的开销和干扰。

    面向异构众核Dcache纵向一致性的调试方法

    公开(公告)号:CN112445696A

    公开(公告)日:2021-03-05

    申请号:CN201910822174.9

    申请日:2019-09-02

    Abstract: 本发明公开一种面向异构众核Dcache纵向一致性的调试方法,包括以下步骤:S1、启动软件调试器,运行可执行程序,设置若干个从核断点;S2、在程序运行到从核断点前,保存现场;S3、在预设的地址空间上预先设计一段指令,用于调用函数Flush,从而刷新当前从核所有Dcache行到主存中,当程序运行到从核断点前时,执行S2;S4、在完成从核Dcache的数据刷新后,利用ret指令,在程序运行到从核断点后,将程序的控制流转回到断点处理程序,实现现场的恢复;S5、当程序完成现场恢复后,返回程序原来的指令,继续往下执行。本发明在不增加硬件实现开销的前提下,保证软件调试时获取到真实有效的数据,从而实现错误现场的精确定位,有效支撑了异构众核上的软件调试,保证了软件调试功能的可用性。

    基于层树网络的大规模并行程序性能数据快速收集方法

    公开(公告)号:CN112445675A

    公开(公告)日:2021-03-05

    申请号:CN201910822230.9

    申请日:2019-09-02

    Abstract: 本发明公开一种基于层树网络的大规模并行程序性能数据快速收集方法,包括以下步骤:S1、依据计算节点启动的进程最多能使用的端口号数目限制M,确定子收集节点所需负责的子节点数目m;S2、根据S1中获得m值,将所需采集性能数据的总进程数N划分为一个各个树层并行度相当的拓扑网络;S3、分析各个树层的数据传输效率比1:η1,η2,...,ηh‑1,其中h为树的深度;S4、根据S3中各个树层的数据传输效率比,实现对拓扑网络的优化;S5、通过socket建立层树收集网络,实现对性能数据的收集。本发明针对异构众核结构特征,结合异构众核处理器的特点,将部分收集进程下沉至计算节点上,并且结合各树层的数据传输效率对树型收集网络进行拓扑优化,能够实现大规模并行程序性能数据的快速收集。

    一种基于程序性能计数的异常进程快速定位方法

    公开(公告)号:CN114238067B

    公开(公告)日:2025-04-11

    申请号:CN202110480190.1

    申请日:2021-04-30

    Abstract: 本发明公开一种基于程序性能计数的异常进程快速定位方法,包括以下步骤:S1、用户提交应用作业;S2、作业调度器在启动应用作业的同时,在每个任务对应的处理器上初始化预设的硬件性能计数器;S3、若程序正常执行直至结束,则基于性能计数器实现的性能计数不对程序产生干扰;S4、若程序执行错误,则启动错误定位处理流程;S45、报告异常任务,用于进一步展开精确的错误原因定位。本发明有效提高了开发人员的调试开发效率、提升了系统资源利用率。

Patent Agency Ranking