-
公开(公告)号:CN112540824B
公开(公告)日:2022-07-12
申请号:CN201910891125.0
申请日:2019-09-20
Applicant: 无锡江南计算技术研究所
IPC: G06F9/455
Abstract: 本发明公开了种基于异构CPU的虚拟机迁移方法,所述异构CPU进一步包括:管控核、计算核、虚拟机操作系统、宿主机操作系统和虚拟机管理模块;包括以下步骤:虚拟机迁移开始,虚拟机的管控核向计算核发送暂停命令,当计算核暂停成功时,计算核的状态维持不变;虚拟机操作系统将计算核的状态存入指定的内存中,所述计算核的状态为寄存器状态、存储器状态和系统调用状态;虚拟机管理模块发出虚拟机暂停命令,虚拟机暂停成功后,虚拟机状态维持不变。本发明虚拟机迁移方法在支持通用虚拟机迁移技术相关接口的基础上,解决了异构架构虚拟机的计算核上进程的迁移问题。
-
公开(公告)号:CN114218521A
公开(公告)日:2022-03-22
申请号:CN202110452546.0
申请日:2021-04-26
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种异构众核架构上基于膨胀取数的卷积运算方法,包括以下步骤:S1、输入input、权重weight、跨步stride,其中input为Hi*Wi,weight为K*K,根据input和weight的形状计算输出output的形状,得到Ho*Wo;S2、根据output的形状,在Ho、Wo维度上,根据每个核的逻辑编号,将卷积计算任务平均分配给众核;S3、每个核根据自己任务大小;S4、每个核通过得到的input(Hi_BLOCK*Wo_BLOCK)和weight,进行卷积计算;S5、重复S3和S4,直到计算完毕。本发明节约了内存带宽资源,同时能够充分运用众核的计算资源。
-
公开(公告)号:CN114218125B
公开(公告)日:2025-05-20
申请号:CN202110381659.6
申请日:2021-04-09
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种基于异构处理器的Fork内存支撑方法,当父进程写被Fork页面、进入内核的缺页处理时,不走核心标准的缺页处理,对页面的缺页处理旁路,具体如下:S11、检查产生缺页的原因是否为写权限导致的;S12、获取页表项对应的物理页面管理结构struct page,并取出其中的Fork_page_info信息;S13、对Fork_page_info信息中的子进程相关数组struct child_pte cp进行遍历;S16、修改Fork页面对应的物理页面管理结构struct page相关计数器;S17、完成缺页处理,返回用户。本发明解决了Fork时内存被替换的问题。
-
公开(公告)号:CN114244692B
公开(公告)日:2024-02-02
申请号:CN202110480187.X
申请日:2021-04-30
Applicant: 无锡江南计算技术研究所
IPC: H04L41/0677 , H04L43/0894
Abstract: 本发明公开一种适用于超大规模互连网络的故障快速定位方法,包括以下步骤:S1、以CPU为单位,每个CPU起2个进程,每个进程占用一个引擎,2个进程进行对发带宽测试,检查带宽是否正常,筛选出PCIE链路及存控有问题的点;S2、以中板为单位,每个CPU上选2个进程,每个进程使用1个引擎,进程以异或算法进行A2A测试,检查每轮通信带宽是否低于阈值,筛选出有问题的计算网交换机;S3、以整个队列为单位,从每个中板中选出指定进程,所有中板一起进行A2A测试,筛选出有问题的顶层网交换机。本发明解决网络故障定位效率低和循环连续检查每个节点造成收发堵塞问题,极大提高网络故障的诊断效率。
-
公开(公告)号:CN112559393B
公开(公告)日:2022-10-04
申请号:CN201910910090.0
申请日:2019-09-25
Applicant: 无锡江南计算技术研究所
IPC: G06F12/1027 , G06F9/455
Abstract: 本发明公开一种基于定制TLB代换的虚拟机迁移时脏页记录方法,包括以下步骤:将虚拟机的迁移标志设置为开启,在虚拟机管理层申请“脏页缓冲区”;判断造成缺页的读写标志,如果是读标志,则需要设置TLB的只读标志位;如果是写标志,计算虚拟地址对应的宿主机页面号,并记录脏页;在数据流异常处理流程中,重填TLB,判断此时TLB是否真正具有只读标志,如果没有则需要记录脏页;否则,进入正常的数据流异常处理流程中。本发明通过虚拟地址到宿主机页面的映射关系,在特权指令模式下实现脏页记录过程,无需维护额外的影子页表,节约大量的内存资源;无需频繁虚拟机退出操作,节约大量的CPU资源,并且大幅度提高了TLB的命中率,进而提高CPU执行效率。
-
公开(公告)号:CN112395079B
公开(公告)日:2022-10-04
申请号:CN201910763777.6
申请日:2019-08-19
Applicant: 无锡江南计算技术研究所
IPC: G06F9/50 , G06F9/455 , G06F9/54 , G06F12/1027
Abstract: 本发明公开一种异构众核架构下的运算核作业迁移方法,基于异构众核架构,包括以下步骤:S1、在作业迁移前,在管理核上建立第一迁移数据结构;S2、通过管理核暂停运算核;S3、判断该运算核是否达到稳定状态;S4、如果运算核达到稳定状态,在管理核建立用于保存运算核上系统状态的结构的第二迁移数据结构,并转S6;S5、如果运算核未达到稳定状态,通过管理核重新启动运算核,等待一段设定的时间后,转S1;S6、启动运算核作业迁移。本发明解决了在异构众核环境下运算核上作业迁移面临的运算核启动停止、作业的保留恢复以及运算核状态的保留等问题,为异构众核架构下的作业迁移提供了切实可靠的基础。
-
公开(公告)号:CN112395005B
公开(公告)日:2022-07-12
申请号:CN201910764140.9
申请日:2019-08-19
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开了一种浮点SIMD上下文切换的性能优化方法,包括以下步骤:在进程描述符结构中增加一CPU标识字段,创建一个全局的数组;进程切换时将被选中进程的浮点SIMD状态最近被装载的CPU号与所述目标CPU号进行匹配,同时将目标CPU最近装载浮点SIMD寄存器的所述进程号与被选中进程号进行匹配,若二者均相等,目标CPU不对进程的浮点SIMD状态进行恢复,此时清除进程的进程标志位FOREIGN_FPSTATE标志,若否,目标CPU对该进程的浮点SIMD状态进行恢复,此时设置进程的进程标志位FOREIGN_FPSTATE标志。本发明减小了内核进程切换开销,对内核改动较小,且适用其他系统寄存器的保留和恢复过程,如性能计数器等。
-
公开(公告)号:CN114218137A
公开(公告)日:2022-03-22
申请号:CN202110478519.0
申请日:2021-04-30
Applicant: 无锡江南计算技术研究所
IPC: G06F12/123
Abstract: 本发明公开一种冗余cache淘汰操作消除方法,包括以下步骤:S1、分析程序代码,直至找到第一个cache淘汰操作;S2、继续分析程序代码,若发现函数调用语句,则执行S3,否则执行S4;S3、依次分析并记录子函数调用链中语句的操作;S4、若找到第二个cache淘汰操作,则将其与第一个cache淘汰操作共同组成cache淘汰操作组;S5、判断是否可对该cache淘汰操作组进行优化,若是则执行S6,否则执行S7;S6、对cache淘汰操作进行优化,并将优化后的cache淘汰操作作为第一个cache淘汰操作,返回S2继续执行。本发明能够实现更优的冗余同步消除,进一步提升优化后程序的运行时性能。
-
公开(公告)号:CN114217939A
公开(公告)日:2022-03-22
申请号:CN202110381609.8
申请日:2021-04-09
Applicant: 无锡江南计算技术研究所
IPC: G06F9/50
Abstract: 本发明公开一种异步通信优化方法,S1、判断物理资源是否满足大于等于用户程序所需进程数2倍的条件;S2、为用户程序的各个进程间隔分配控制核心作为进程控制核心,并在每个用户进程之间启用一个空闲的控制核心作为专用控制核心,所述进程控制核心与所述专用控制核心组成与用户进程一一对应的异步控制核心;S3、实现单个进程控制核心与多个运算核心阵列的逻辑组合;S6、当位于进程控制核心的用户程序进程(主线程)进行与位于专用控制核心的通信探查服务关键互斥操作时,对线程信号量置1,以主动抢锁并进行关键互斥操作,抢锁成功后信号量置0,允许通信探查服务继续竞争线程锁。本发明可有效提升通信密集型大规模并发应用的整体性能。
-
公开(公告)号:CN112558999A
公开(公告)日:2021-03-26
申请号:CN201910910088.3
申请日:2019-09-25
Applicant: 无锡江南计算技术研究所
IPC: G06F8/65 , G06F8/71 , G06F9/4401
Abstract: 本发明公开一种基于BMC的海量节点固件版本管理及网络加载方法,从对应的外围节点读取此节点配置,如果配置为BMC启动,则从对应BMC节点加载固件,否则从外围节点加载固件;通过外围节点作为代理,将所有最新版本的固件更新到相应的BMC节点;并行检查外围节点中的固件版本;每个外围节点向负责的BMC节点发布查询命令,并收集BMC节点的返回结果。本发明实现了基于BMC的网络加载技术,可以避免海量节点启动时的网络阻塞,极大降低海量节点开机时间;降低了发布固件的时间;避免了并行发布和管理固件版本的线程爆炸。
-
-
-
-
-
-
-
-
-