-
公开(公告)号:CN105426296B
公开(公告)日:2018-04-10
申请号:CN201510826916.7
申请日:2015-11-24
Applicant: 无锡江南计算技术研究所
IPC: G06F11/34
Abstract: 本发明提供了一种基于插装标签的核间协同多线程PMU事件监测方法,用于异构众核处理器。异构众核处理器包括用于执行计算操作的运算核心和用于执行控制和服务操作的运算控制核心。其中,运算控制核心设置各个运算核心上运行的线程所关心的性能事件;初始化各个运算核心上运行的线程的PMU;在各个运算核心上运行的线程上插装标签;运算控制核心在后台透明地收集各个运算核心上运行的线程上的插装标签所实时返回的数据;运算控制核心集中整理分析返回的数据以执行性能监测记录,从而形成统一的全处理器的性能监测。
-
公开(公告)号:CN105282017A
公开(公告)日:2016-01-27
申请号:CN201510831796.X
申请日:2015-11-24
Applicant: 无锡江南计算技术研究所
Abstract: 本发明提供了一种基于扁平化模型的通信实现方法,可用于点对点通信和集合通信。所述方法包括:运算核心将用户消息的描述符在内存中进行组装;所述运算核心通过写内存方式,将描述符地址信息作为消息请求通知给控制核心;所述控制核心通过创建轮询线程的方式,查询运算核心的消息请求,通过消息请求中携带的描述符地址信息,取出描述符进行消息匹配;所述控制核心利用消息匹配的结果与远程控制核心进行消息通信。
-
公开(公告)号:CN102981839B
公开(公告)日:2015-08-12
申请号:CN201210441329.2
申请日:2012-11-06
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开了一种合并执行大规模并行线程的数据扩展优化方法,包括:在合并执行的并行线程中识别线程不变量;所述线程不变量在每个合并执行的并行线程中保持一致;编译过程中,仅对非线程不变量,进行数据扩展。本发明减少了不必要的线程私有数据扩展,能有效缓解合并后栈空间的剧烈膨胀,提高程序的执行效率。
-
公开(公告)号:CN102929580B
公开(公告)日:2015-07-08
申请号:CN201210442053.X
申请日:2012-11-06
Applicant: 无锡江南计算技术研究所
IPC: G06F9/30
Abstract: 一种数组多引用访问的分块方法和装置,其中,所述数组多引用访问的分块方法包括:分析程序内各循环内的数组访问模式,根据所述数组访问模式进行各循环内数组访问的关联关系分析,所述关联关系包括关联类型和关联距离;根据数组访问的关联类型和关联距离,结合存储系统结构特征计算数组分块参数和缓冲大小参数;输出数组访问的数组分块参数和缓冲大小参数。本发明的数组多引用访问的分块方法分析了应用程序中多个引用访问之间的相关性,又考虑了系统存储架构的结构限制,确保可以获得有效的数组分块参数和缓冲大小参数。
-
公开(公告)号:CN102946379A
公开(公告)日:2013-02-27
申请号:CN201210394765.9
申请日:2012-10-16
Applicant: 无锡江南计算技术研究所
Abstract: 大规模并行系统下的多层摘要文件生成方法及文件正确性验证方法。多层摘要文件生成方法包括:以原始Hash块大小为单位,将目标文件拆分成多个一级文件;用报文摘要算法为每个一级文件生成一级层间摘要;基于一级层间摘要,至少使用一次报文摘要算法生成总摘要。文件正确性验证方法包括:读取文件对应的多层摘要文件,获取原始Hash块大小;以原始Hash块大小为单位,将文件拆分成多个一级文件;用报文摘要算法为每个一级文件生成一级层间摘要,将一级层间摘要与多层摘要文件中对应的一级层间摘要进行比较,若不一致,则输出错误信息。本发明可在大规模并行系统上快速实现大量文件的正确性检查。
-
公开(公告)号:CN102929707A
公开(公告)日:2013-02-13
申请号:CN201210438264.6
申请日:2012-11-06
Applicant: 无锡江南计算技术研究所
Abstract: 一种并行任务动态分配方法,适用于包括多级用户进程的并行系统,所述多级用户进程包括至少两级主进程和普通进程。该方法包括:主进程将本级待分配的并行任务排序,形成本级待分配任务队列;接收下一级用户进程发送的任务请求消息及所请求的任务数量;从本级待分配任务队列的队首开始,按照下一级用户进程所请求的任务数量,为下一级用户进程分配任务,并更新本级待分配任务队列。本发明可提高动态任务分配的效率,以达到众多计算资源间的负载平衡。
-
公开(公告)号:CN112540899B
公开(公告)日:2022-10-04
申请号:CN201910892364.8
申请日:2019-09-20
Applicant: 无锡江南计算技术研究所
IPC: G06F11/34
Abstract: 本发明公开了一种基于性能数据时空特性的分析装置,包括代码采集装置、性能采集装置、处理装置和显示装置,所述代码采集装置用于统计比重大于1%的代码空间、相同或具有90%以上重叠的代码空间、相同代码空间出现的时间节点和时间间隔以及同一代码空间与不同代码空间相邻出现的代码模式;所述性能采集装置根据代码采集装置的采集信息采集对应的性能事件;所述处理装置对采集信息进行处理,并筛选出性能事情的优缺点;所述显示装置根据处理装置输入的筛选信息,在显示屏上输出并行程序的缺陷的和优化方向。本发明能够快速定位程序的性能瓶颈,并为用户提供优化方向,分析效率高、优化速度快。
-
公开(公告)号:CN112445696B
公开(公告)日:2022-09-13
申请号:CN201910822174.9
申请日:2019-09-02
Applicant: 无锡江南计算技术研究所
IPC: G06F11/36
Abstract: 本发明公开一种面向异构众核Dcache纵向一致性的调试方法,包括以下步骤:S1、启动软件调试器,运行可执行程序,设置若干个从核断点;S2、在程序运行到从核断点前,保存现场;S3、在预设的地址空间上预先设计一段指令,用于调用函数Flush,从而刷新当前从核所有Dcache行到主存中,当程序运行到从核断点前时,执行S2;S4、在完成从核Dcache的数据刷新后,利用ret指令,在程序运行到从核断点后,将程序的控制流转回到断点处理程序,实现现场的恢复;S5、当程序完成现场恢复后,返回程序原来的指令,继续往下执行。本发明在不增加硬件实现开销的前提下,保证软件调试时获取到真实有效的数据,从而实现错误现场的精确定位,有效支撑了异构众核上的软件调试,保证了软件调试功能的可用性。
-
公开(公告)号:CN112445675B
公开(公告)日:2022-09-13
申请号:CN201910822230.9
申请日:2019-09-02
Applicant: 无锡江南计算技术研究所
IPC: G06F11/30
Abstract: 本发明公开一种基于层树网络的大规模并行程序性能数据快速收集方法,包括以下步骤:S1、依据计算节点启动的进程最多能使用的端口号数目限制M,确定子收集节点所需负责的子节点数目m;S2、根据S1中获得m值,将所需采集性能数据的总进程数N划分为一个各个树层并行度相当的拓扑网络;S3、分析各个树层的数据传输效率比1:η1,η2,...,ηh‑1,其中h为树的深度;S4、根据S3中各个树层的数据传输效率比,实现对拓扑网络的优化;S5、通过socket建立层树收集网络,实现对性能数据的收集。本发明针对异构众核结构特征,结合异构众核处理器的特点,将部分收集进程下沉至计算节点上,并且结合各树层的数据传输效率对树型收集网络进行拓扑优化,能够实现大规模并行程序性能数据的快速收集。
-
公开(公告)号:CN114238067A
公开(公告)日:2022-03-25
申请号:CN202110480190.1
申请日:2021-04-30
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种基于程序性能计数的异常进程快速定位方法,包括以下步骤:S1、用户提交应用作业;S2、作业调度器在启动应用作业的同时,在每个任务对应的处理器上初始化预设的硬件性能计数器;S3、若程序正常执行直至结束,则基于性能计数器实现的性能计数不对程序产生干扰;S4、若程序执行错误,则启动错误定位处理流程;S45、报告异常任务,用于进一步展开精确的错误原因定位。本发明有效提高了开发人员的调试开发效率、提升了系统资源利用率。
-
-
-
-
-
-
-
-
-