-
公开(公告)号:CN112445547A
公开(公告)日:2021-03-05
申请号:CN201910822171.5
申请日:2019-09-02
Applicant: 无锡江南计算技术研究所
IPC: G06F9/448 , G06F15/163
Abstract: 本发明公开一种面向异构众核处理器的低扰动性能数据采集方法,用于国产众核处理器,包括以下步骤:S1、在主核设置需要采集的性能数据所对应的性能事件,并对性能事件进行分类;S2、通过CSR寄存器设置硬件计数器的初值、计数使能控制、计数事件的选择,即将性能事件选择为计数事件,以实现对硬件计数器的初始化;S3、用户对需要进行性能数据采集的程序段进行插装,通过计算获得该程序段触发该性能事件的次数为两次统计接口函数的差值;S4、主核通过读取保存在统计接口参数地址中的性能事件的计数值实现性能数据的采集。本发明可以对多类性能事件进行并行采集,大大提高了数据采集效率,实现了高效全面、对程序低扰动的性能数据采集。
-
公开(公告)号:CN105391658B
公开(公告)日:2018-07-06
申请号:CN201510830368.5
申请日:2015-11-24
Applicant: 无锡江南计算技术研究所
IPC: H04L12/933 , H04L12/947
Abstract: 本发明提供了一种基于物理位置感知的集合通信方法,包括:感知目的进程的位置;在目的进程和位于同一物理芯片内时,通过查询确定本地运算核心是否空闲;在本地运算核心空闲的情况下,通过本地运算核心发起存储器直接访问操作,将通信数据直接写入所述同一物理芯片上的目的进程主存中,以使得所述同一物理芯片内的通信不需要再通过网络接口进行中转。本发明进行大规模集合通信时,通过感知目的进程的位置,结合路由芯片路由算法,根据无端口冲突原则,使得通信间的路由冲突最小化。
-
公开(公告)号:CN105243023B
公开(公告)日:2017-09-26
申请号:CN201510831795.5
申请日:2015-11-24
Applicant: 无锡江南计算技术研究所
Abstract: 本发明提供了一种并行运行时错误检测方法,包括:设置初始值为0的第一计数器和第二计数器;在进程进入一个MPI阻塞操作时,第一计数器加一,并启动一个定时器;在从该阻塞操作返回时,将第一计数器的值赋给第二计数器,并取消定时器;而且,如果该MPI阻塞在一个MPI调用中,则在定时器满时触发一个软中断信号,从而进入一个中断处理函数,在中断处理函数中比较第一计数器和第二计数器的当前值,如果第一计数器和第二计数器的当前值不相等,则执行状态转储并随后执行死锁检测;如果第一计数器和第二计数器的当前值相等,则从中断处理函数返回,并继续执行并行程序。
-
公开(公告)号:CN102929707B
公开(公告)日:2015-10-07
申请号:CN201210438264.6
申请日:2012-11-06
Applicant: 无锡江南计算技术研究所
Abstract: 一种并行任务动态分配方法,适用于包括多级用户进程的并行系统,所述多级用户进程包括至少两级主进程和普通进程。该方法包括:主进程将本级待分配的并行任务排序,形成本级待分配任务队列;接收下一级用户进程发送的任务请求消息及所请求的任务数量;从本级待分配任务队列的队首开始,按照下一级用户进程所请求的任务数量,为下一级用户进程分配任务,并更新本级待分配任务队列。本发明可提高动态任务分配的效率,以达到众多计算资源间的负载平衡。
-
公开(公告)号:CN102981836B
公开(公告)日:2015-08-12
申请号:CN201210438958.X
申请日:2012-11-06
Applicant: 无锡江南计算技术研究所
Abstract: 一种异构系统的编译方法和编译器,其中,所述的异构系统的编译方法包括:识别系统服务语句,分离计算语句和所述系统服务语句,对所述系统服务语句进行标识;对系统服务语句进行格式解析,收集系统服务信息数据;在从核程序中生成第一语句,将所述系统服务信息数据打包传送到主核端I/O缓冲,并向主核端发送服务请求;在主核程序中生成第二语句,包括从核计算加载服务程序和与所述服务请求相应的系统服务程序;在所述主核程序中生成第三语句,根据所述标识对所述系统服务程序进行轮询处理,并依据所述主核端I/O缓冲中的数据处理所述系统服务程序。本发明的异构系统的编译方法和编译器,在异构系统上实现了用户层同构视角的编程。
-
公开(公告)号:CN102981839A
公开(公告)日:2013-03-20
申请号:CN201210441329.2
申请日:2012-11-06
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开了一种合并执行大规模并行线程的数据扩展优化方法,包括:在合并执行的并行线程中识别线程不变量;所述线程不变量在每个合并执行的并行线程中保持一致;编译过程中,仅对非线程不变量,进行数据扩展。本发明减少了不必要的线程私有数据扩展,能有效缓解合并后栈空间的剧烈膨胀,提高程序的执行效率。
-
公开(公告)号:CN101452379A
公开(公告)日:2009-06-10
申请号:CN200710094330.1
申请日:2007-11-28
Applicant: 无锡江南计算技术研究所
Abstract: 一种内存空间的分析方法和装置、检查点的保留方法和装置,所述内存空间的分析方法包括下述步骤:在程序中设置潜在检查点,所述潜在检查点为分析内存空间的指示;在潜在检查点的作用范围内,分析是否有不需要保留的内存空间;若有不需要保留的内存空间,则标识所述内存空间不需要保留的属性的作用域。所述内存空间的分析方法和检查点的保留方法可以减少透明检查点的保留量和缩短保留恢复时间。
-
公开(公告)号:CN114238067B
公开(公告)日:2025-04-11
申请号:CN202110480190.1
申请日:2021-04-30
Applicant: 无锡江南计算技术研究所
IPC: G06F11/362 , G06F18/23
Abstract: 本发明公开一种基于程序性能计数的异常进程快速定位方法,包括以下步骤:S1、用户提交应用作业;S2、作业调度器在启动应用作业的同时,在每个任务对应的处理器上初始化预设的硬件性能计数器;S3、若程序正常执行直至结束,则基于性能计数器实现的性能计数不对程序产生干扰;S4、若程序执行错误,则启动错误定位处理流程;S45、报告异常任务,用于进一步展开精确的错误原因定位。本发明有效提高了开发人员的调试开发效率、提升了系统资源利用率。
-
公开(公告)号:CN114244548B
公开(公告)日:2023-10-13
申请号:CN202110387706.8
申请日:2021-04-12
Applicant: 无锡江南计算技术研究所
IPC: H04L9/40 , H04L67/1004 , H04L67/30 , H04L67/63
Abstract: 本发明公开一种面向云IDE的动态调度和用户认证方法,包括以下步骤:S1、用户在浏览器中输入统一登录地址和指定服务端口,输入用户名和口令;S2、Nginx服务将接收自S1的用户名和口令作为认证信息,对认证信息进行认证;S3、开发服务器上的开发服务接收到请求信息,检测开发环境工具服务是否启动成功,如果不成功,报错,如果成功,则携带用户信息向Nginx服务发送请求;S4、根据转发策略,推算出要转发给某一台固定开发服务器上的开发环境工具服务;S5、利用用户信息实现用户认证,如果认证通过,进入开发界面。本发明解决了开发工具的动态调度、用户认证服务以及资源负载均衡的问题。
-
公开(公告)号:CN112631816B
公开(公告)日:2022-11-15
申请号:CN201910904061.3
申请日:2019-09-24
Applicant: 无锡江南计算技术研究所
IPC: G06F11/07
Abstract: 本发明公开了一种基于调试日志的并行程序错误定位方法,基于异构众核处理器,包括以下步骤:S1:将基于调试日志的错误定位装置插装进消息传递的并行运行时库中;S2:当程序挂住时发出通知,执行应用感知;S3:综合调试日志,定位异类进程:A1:分析pi的Nr队列;A2:如果存在一个Nr:pj→pi,则以pj为新的切入点,查找Ns:pj→pi;A3:如果发现匹配的Ns,即判断通信挂起的原因为该消息未成功发送;A4:如果未发现匹配的Ns,则继续检查pi的Nr队列,查找Ur;A5:直到pi的Nr队列全部检查;S4:输出错误定位报告。本发明在实现具有大规模问题的并行程序的错误定位的同时,显著加快了大规模并行程序通信死锁的定位。
-
-
-
-
-
-
-
-
-