-
公开(公告)号:CN114244692A
公开(公告)日:2022-03-25
申请号:CN202110480187.X
申请日:2021-04-30
Applicant: 无锡江南计算技术研究所
IPC: H04L41/0677 , H04L43/0894
Abstract: 本发明公开一种适用于超大规模互连网络的故障快速定位方法,包括以下步骤:S1、以CPU为单位,每个CPU起2个进程,每个进程占用一个引擎,2个进程进行对发带宽测试,检查带宽是否正常,筛选出PCIE链路及存控有问题的点;S2、以中板为单位,每个CPU上选2个进程,每个进程使用1个引擎,进程以异或算法进行A2A测试,检查每轮通信带宽是否低于阈值,筛选出有问题的计算网交换机;S3、以整个队列为单位,从每个中板中选出指定进程,所有中板一起进行A2A测试,筛选出有问题的顶层网交换机。本发明解决网络故障定位效率低和循环连续检查每个节点造成收发堵塞问题,极大提高网络故障的诊断效率。
-
公开(公告)号:CN114221871A
公开(公告)日:2022-03-22
申请号:CN202110381666.6
申请日:2021-04-09
Applicant: 无锡江南计算技术研究所
IPC: H04L41/12 , H04L67/1095 , H04L12/18
Abstract: 本发明公开一种网格化流水的全收集方法,包括以下步骤:S1、将每个超节点内的进程组织为一个分组,每个分组不必具备同样多的进程;S2、每个分组选出任意一个进程作为代表进程,参与到组间的通信中,由此构成二级网格化通信结构,并将二级网格化通信结构映射到大规模集群互联网络结构;S3、在所述二级网格化通信结构上,先在各组内完成数据的收集和共享,再开启全局流水。本发明能够合理利用资源,实现全收集集合通信中的通信聚合和顶层网络的带宽节省,有效提高了全收集集合通信的性能,对通信密集型应用具有积极影响。
-
公开(公告)号:CN114218846A
公开(公告)日:2022-03-22
申请号:CN202110324746.8
申请日:2021-03-26
Applicant: 无锡江南计算技术研究所
IPC: G06F30/27 , G06F119/02
Abstract: 本发明公开一种超级计算机计算资源故障预测方法,包括以下步骤:S1、每隔s秒采集一个计算节点的特征信息,记为x1s;N个s秒为时间窗口T;S2、经过m个时间窗口T的数据积累,得到m个总特征X作为输入样本;S3、将S2中经数据处理后的m个总特征X和对应状态Y按batch大小划分成组;S4、从(m+1)个时间窗口T开始,将采集到的最新的总特征X_test和对应状态Y_test根据S2进行数据处理;S5、设置阈值并对比预测结果Y’和对应状态Y_test,当偏差大于设定的阈值时,将训练模型进行调参重训练,重复S4。本发明解决了超级计算机计算资源故障难以有效提前预测的问题。
-
公开(公告)号:CN114218523A
公开(公告)日:2022-03-22
申请号:CN202110483033.6
申请日:2021-04-30
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种异构众核架构上的矩阵转置方法,针对大规模矩阵M*N,其中,M%8=0,N%8=0;包括以下步骤:S1、将大规模矩阵M*N以8×8粒度分块;S2、从核阵列共64个从核,利用混洗指令对该分块转置;转置运算前开始读入第k+64个分块进从核LDM,即该从核要处理的下一轮分块;S2.2、如果S2.1中读取的第p轮分块为原矩阵第i行第j列分块,则将其转置后的分块矩阵存储于新矩阵的第j行第i列分块;S2.3、当从核处理完毕第p轮分块;S3、当从核阵列处理完所有分块后,得到原矩阵的转置矩阵。本发明可以充分利用加速指令中的混洗指令进行向量化加速,突破了传统的矩阵转置算法,充分发挥硬件潜力。
-
公开(公告)号:CN114218150A
公开(公告)日:2022-03-22
申请号:CN202110481454.5
申请日:2021-04-30
Applicant: 无锡江南计算技术研究所
IPC: G06F15/167 , G06F9/50 , G06F13/28
Abstract: 本发明公开一种异构众核架构上CPU共享数组引导维选取策略,对矩阵引导维进行如下调整,并存储于CPU共享空间中:S1、申请CPU共享空间时,控制申请空间的首地址即src 128B对界,使得从核DMA取时源地址始终128B对界;S2选取ld=64*(6a+1),a为满足64*(6a+1)>=N的最小整数值;S3、如果S2中取得的ld%31==0,取a=a+1,使得体冲突问题得到规避;S4、M×N双精度矩阵,行主序,以S3中取得的ld作为引导维,以src为首地址,存储在CPU共享空间中。本发明平衡从核DMA取数据时各个存控上的访存量,实现负载均衡,且规避存控体冲突。
-
公开(公告)号:CN114218147A
公开(公告)日:2022-03-22
申请号:CN202110480202.0
申请日:2021-04-30
Applicant: 无锡江南计算技术研究所
IPC: G06F15/163
Abstract: 本发明公开一种计算核心加速的通信优化方法,包括以下步骤:S1、控制核心通过检查运算核心的状态参数,感知运算核心是否处于空闲状态;S2、若运算核心处于空闲状态,则利用运算核心的聚合访存能力加速通信中的数据传输或者利用运算核心的计算能力加速通信中的数据计算,实现通信优化;若运算核心不空闲,则利用控制核心正常通信;S3、通信完毕,优化结束。本发明将通信协议的部分步骤卸载至运算核心阵列,利用运算核心来提升通信性能,实现通信支撑服务与异构体系结构的深度融合,以达到加速通信过程的目的。
-
公开(公告)号:CN114218125A
公开(公告)日:2022-03-22
申请号:CN202110381659.6
申请日:2021-04-09
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种基于异构处理器的Fork内存支撑方法,当父进程写被Fork页面、进入内核的缺页处理时,不走核心标准的缺页处理,对页面的缺页处理旁路,具体如下:S11、检查产生缺页的原因是否为写权限导致的;S12、获取页表项对应的物理页面管理结构struct page,并取出其中的Fork_page_info信息;S13、对Fork_page_info信息中的子进程相关数组struct child_pte cp进行遍历;S16、修改Fork页面对应的物理页面管理结构struct page相关计数器;S17、完成缺页处理,返回用户。本发明解决了Fork时内存被替换的问题。
-
公开(公告)号:CN114218067A
公开(公告)日:2022-03-22
申请号:CN202110483009.2
申请日:2021-04-30
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种异构众核软件调试装置及调试方法,包括以下配置:从核调试代理线程sdbth:sdbth由主核OS创建,运行在被跟踪进程tracee的地址空间内,循环执行一个低优先级的睡眠;在调试器进程debug中增加一套从核架构数据和一个切换开关;从核架构数据包括反汇编、硬件寄存器的读写、硬件断点的插入和删除操作、软件单步算法中下一条指令的地址计算;切换开关,用于控制主核与从核两种处理器架构的切换。本发明可实现对异构并行代码的执行跟踪和错误定位。
-
公开(公告)号:CN114217943A
公开(公告)日:2022-03-22
申请号:CN202110398330.0
申请日:2021-04-14
Applicant: 无锡江南计算技术研究所
IPC: G06F9/50
Abstract: 本发明公开一种通信支撑环境的初始化方法,包括以下步骤:S1、调用作业管理接口,解析本道作业的资源总数tasksize、各进程在作业中的初始资源序号Sid、资源名列表nodeidlist、资源片内唯一标识mpeidlist、pid列表pidlist、网络设备标识列表guidlist,并按资源列表自然序排列;S2、根据各进程的初始资源序号Sid计算Sid%cg_per_process,从作业系统返回信息中提取满足模cg_per_process为0的进程的相关信息。本发明有助于支撑用户求解更大的问题规模、追求更高的性能,且实现简便,不影响消息性能,用户调用消息接口时无额外开销。
-
公开(公告)号:CN114217936A
公开(公告)日:2022-03-22
申请号:CN202110209594.7
申请日:2021-02-25
Applicant: 无锡江南计算技术研究所
IPC: G06F9/50
Abstract: 本发明公开一种高效大气模式物理过程任务划分算法,包括以下步骤:S1、获取大气模式中各进程所在的超节点编号;S2、根据S1中获取的超节点编号信息,对大气模式中的各进程进行分组,将具有相同超节点编号的进程分到同一个组;S3、第一级任务划分,采用与动力框架采用相同的网格划分方式,保证同一组进程中大气模式动力框架与物理过程具有相同的网格;S4、第二级任务划分,调整大气模式物理过程中组内进程间网格划分,将网格重分配到组内进程中。本发明既能使大气模式物理过程计算任务相对平衡,又能减少大气模式与动力框架耦合时的通信开销,可显著提高大气模式大规模并行时的整体性能。
-
-
-
-
-
-
-
-
-