-
公开(公告)号:CN112540871A
公开(公告)日:2021-03-23
申请号:CN201910891118.0
申请日:2019-09-20
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种通用寄存器保留恢复的实现方法,进程保留方法:用户进程调用系统调用ioctl函数;在ioctl函数中设置进程flag保留/恢复标志位;内核态切换到用户态,根据linux信号处理机制进入到对保留/恢复标志位判断;如果存在保留/恢复标志位,进入do_work_pending处理函数;do_work_pending处理函数将内核栈上的通用寄存器$0~$29全部保存到文件或指定内存中;进程恢复方法:其前三步骤与进程保留方法步骤相同,内核态切换到用户态,根据linux信号处理机制会进入到对保留/恢复标志位判断;如果存在保留/恢复标志位,进入do_work_pending处理函数;do_work_pending处理函数中将文件或指定内存中保存的通用寄存器$0~$29恢复到内核栈上,do_work_pending处理函数退出后,用户进程返回用户态。本发明解决了通用寄存器保留不完整的问题。
-
公开(公告)号:CN112540864A
公开(公告)日:2021-03-23
申请号:CN201910898085.2
申请日:2019-09-23
Applicant: 无锡江南计算技术研究所
IPC: G06F11/07
Abstract: 本发明公开一种主从一体的内核级调试支撑及异常快速定位方法,计算核运行过程中发生了异常或故障;计算核将异常或故障产生中断发向管理核;管理核收到中断后进入到中断处理程序,操作系统内核收到中断,会快速响应进入错误定位模块,错误定位模块根据中断的类型和对应的状态寄存器进行树形分类;如果是程序异常状态,程序异常处理模块会产生对应的信号和错误记录;如果硬件异常,硬件异常处理模块中断计算核程序并在操作系统内核中进行警告,并通知高层用户管理员;如果硬件发生故障,硬件故障处理模块会强制系统停机且通知系统管理员。本发明有效提高了计算核错误异常的定位、处理能力以及效率,提升了国产异构众核的系统运行的好用性和可用性。
-
公开(公告)号:CN112540855A
公开(公告)日:2021-03-23
申请号:CN201910891116.1
申请日:2019-09-20
Applicant: 无锡江南计算技术研究所
IPC: G06F9/54
Abstract: 本发明公开了一种通信域的集中式管理方法,创建通信域数据结构;通信域的根进程向全局主进程发起申请,全局主进程收到申请后分配管理索引;全局主进程收从资源列表中读取资源信息,通过通信优化策略从资源列表中选择生成可用资源信息,并通知根进程;将生成可用资源信息加入全局通信域队列中;用户发起消息,运行时库使用本进程通信域队列中的可用资源信息读写数据和通信;发送消息后,运行时库通过轮询本进程通信域队列中消息状态,状态异常的消息触发容错流程。本发明将创建的通信域进行集中式管理的机制,有助于提高物理和软件资源利用效率,在通信域的数据结构中添加可用资源信息,帮助用户实现资源的高效利用和对程序运行状态的查询。
-
公开(公告)号:CN112527263A
公开(公告)日:2021-03-19
申请号:CN201910885748.7
申请日:2019-09-19
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种基于国产异构平台的自适应可变参数优化方法,包括以下步骤:S1、根据架构信息选择相应架构的ABI接口,编译器前端根据相应的ABI接口中的ABI约定对源程序进行处理,生成中间表示;S2、编译器后端扫描分析函数中的可变参函数,收集可变参函数的参数使用情况;S3、根据S2中扫描分析得到的信息,依据可变参数的数据类型和可变参数所存入的寄存器的不同,对可变参数进行后端对函数降级前的处理,为编译器后端的函数降级过程做准备;S4、编译器后端对可变参数的内建函数进行降级处理,获得降级后的中间表示;S5、生成汇编文件,即根据降级后的中间表示生成汇编指令。本发明实现了优化可变参函数的内存和减少访存指令的算法,提高了程序的性能。
-
公开(公告)号:CN112486662A
公开(公告)日:2021-03-12
申请号:CN201910863064.7
申请日:2019-09-12
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种基于属性控制的大规模系统隐式并行管理方法,包括对计算资源内隐式的作业管理控制和对虚拟计算资源信息的属性化展示,所述作业管理控制包括以下步骤:S11、启动运行控制域管理服务;S12、启动对虚拟计算资源的运行控制服务;S13、运行控制服务与运行控制域管理服务连接通信,构成计算资源内的独立层次运行控制域;S14、将作业启动请求、运行控制请求和管理请求发送至计算资源;S15、判断计算资源是否为虚拟化使用模式;S16、计算资源宿主机内的运行控制域管理服务接收虚拟机内的运行控制服务发回的各类管理控制结果。本发明提升大规模系统分布式运行控制的可扩展性,解决了因计算资源虚拟化导致的基础计算资源数量增多带来的运行控制扩展性压力问题。
-
公开(公告)号:CN112486424A
公开(公告)日:2021-03-12
申请号:CN201910861483.7
申请日:2019-09-12
Applicant: 无锡江南计算技术研究所
IPC: G06F3/12
Abstract: 本发明公开了一种用户透明的运算核并行打印保序代理方法,对运算核上的打印输出语句进行扩展替换,将打印输出语句变换成调用运行时系统中的线程打印处理函数;对线程打印处理函数进行参数解析,申请数据转存缓冲区,根据参数类型进行数据转存;运算核请求控制核进行打印保序代理,将申请的数据转存缓冲区首地址传送给控制核;控制核接到中断信号,转入中断处理,根据数据转存缓冲的参数类型执行嵌汇编指令装填打印函数参数,调用printf代理实现运算核打印输出。本发明采用编译器和运行时相结合,自动完成所有运算核的并行有序输出;对用户透明且不需要对运算核的打印输出进行额外管理;只需要运算核的基础编译器对运算核程序进行简单的程序变换即可。
-
公开(公告)号:CN112445696A
公开(公告)日:2021-03-05
申请号:CN201910822174.9
申请日:2019-09-02
Applicant: 无锡江南计算技术研究所
IPC: G06F11/36
Abstract: 本发明公开一种面向异构众核Dcache纵向一致性的调试方法,包括以下步骤:S1、启动软件调试器,运行可执行程序,设置若干个从核断点;S2、在程序运行到从核断点前,保存现场;S3、在预设的地址空间上预先设计一段指令,用于调用函数Flush,从而刷新当前从核所有Dcache行到主存中,当程序运行到从核断点前时,执行S2;S4、在完成从核Dcache的数据刷新后,利用ret指令,在程序运行到从核断点后,将程序的控制流转回到断点处理程序,实现现场的恢复;S5、当程序完成现场恢复后,返回程序原来的指令,继续往下执行。本发明在不增加硬件实现开销的前提下,保证软件调试时获取到真实有效的数据,从而实现错误现场的精确定位,有效支撑了异构众核上的软件调试,保证了软件调试功能的可用性。
-
公开(公告)号:CN112445675A
公开(公告)日:2021-03-05
申请号:CN201910822230.9
申请日:2019-09-02
Applicant: 无锡江南计算技术研究所
IPC: G06F11/30
Abstract: 本发明公开一种基于层树网络的大规模并行程序性能数据快速收集方法,包括以下步骤:S1、依据计算节点启动的进程最多能使用的端口号数目限制M,确定子收集节点所需负责的子节点数目m;S2、根据S1中获得m值,将所需采集性能数据的总进程数N划分为一个各个树层并行度相当的拓扑网络;S3、分析各个树层的数据传输效率比1:η1,η2,...,ηh‑1,其中h为树的深度;S4、根据S3中各个树层的数据传输效率比,实现对拓扑网络的优化;S5、通过socket建立层树收集网络,实现对性能数据的收集。本发明针对异构众核结构特征,结合异构众核处理器的特点,将部分收集进程下沉至计算节点上,并且结合各树层的数据传输效率对树型收集网络进行拓扑优化,能够实现大规模并行程序性能数据的快速收集。
-
公开(公告)号:CN112445661A
公开(公告)日:2021-03-05
申请号:CN201910805747.7
申请日:2019-08-29
Applicant: 无锡江南计算技术研究所
IPC: G06F11/22
Abstract: 本发明公开一种并行访存汇编程序自动生成系统和存储一致性测试方法,包括以下步骤:S1、并行程序生成器读取控制核心和运算核心的汇编程序框架,并且根据核心的数目生成包含相应数目汇编函数的基础汇编程序;S2、并行访存指令序列生成器生成访存指令序列偏移链表,将访存偏移平均分给各个核心,并根据各个核心分到的访存偏移,生成访存指令段;S3、各个核心的访存指令序列分别嵌入各自的汇编函数中;S4、主函数通过读取数据集合来实现源空间的初始化;S5、访存结束,再次进行同步,然后比较目的空间的哈希值与源空间的哈希值是否相等。本发明可以自动生成并行访存的汇编程序,大大增加访存的密集度,减少运算的时间,提高测试效率。
-
公开(公告)号:CN112445636A
公开(公告)日:2021-03-05
申请号:CN201910832284.3
申请日:2019-09-04
Applicant: 无锡江南计算技术研究所
IPC: G06F11/07 , G06F16/215 , G06F16/22 , G06F16/2458
Abstract: 本发明公开一种基于序列模式的DRAM故障关联分析方法,包括以下步骤:对故障数据库中的非DRAM故障进行过滤,获得所需的DRAM故障数据;获得DRAM故障序列数据库;建立序列DRAM故障序列数据库;采用GSP算法,设定支持度,扫描序列DRAM故障序列数据库,获取所有满足支持度要求的DRAM故障序列的支持度;筛选出DRAM严重故障与DRAM严重故障、DRAM非严重故障与DRAM严重故障的序列规则,并计算其置信度;筛选出置信度大于60%的序列规则;如果出现反映DRAM严重故障与DRAM严重故障的序列规则,则表明DRAM严重故障与DRAM严重故障存在关联性;如果未出现反映DRAM非严重故障与DRAM严重故障关联的序列规则,则表明DRAM非严重故障不会导致DRAM严重故障。本发明解决了故障分析与预测关心的预测预警问题,具备高可信性和通用性,优化了分析执行效率。
-
-
-
-
-
-
-
-
-