-
公开(公告)号:CN110659182A
公开(公告)日:2020-01-07
申请号:CN201910862948.0
申请日:2019-09-12
Applicant: 无锡江南计算技术研究所
IPC: G06F11/30 , G06F16/21 , G06F16/2458
Abstract: 一种高性能计算机监控方法及系统,属于高性能计算机系统监控技术领域。本发明的方法包括:轮询采集一般监控数据,中断采集重点监控数据;对采集到的一般监控数据和重点监控数据按实时数据和历史数据进行分类存储;根据监控请求,将相应的数据缓存,并进行实时推送。本发明的系统包括:轮询数据采集器、中断数据采集器、代理模块、内存数据库、时序数据库、web后端、消息中间件、web前端、服务器。本发明能够有效提高监控系统的数据实时性及查询效率。
-
公开(公告)号:CN113485861A
公开(公告)日:2021-10-08
申请号:CN202110772240.3
申请日:2021-07-08
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开了一种基于资源优化策略的基层故障诊断方法及装置,该方法包括构建整机故障诊断树,整机故障诊断树包括由系统基层至顶层分别设置的第一级管理单元、第二级管理单元、第三级管理单元;当各第一级管理单元采集到总错监控数据时,对总错监控数据进行故障解析,确定故障数据信息;生成各故障数据信息对应的各故障诊断结果,并将各故障诊断结果发送至第二级管理单元;第二级管理单元对接收到的各故障诊断结果进行过滤后,将过滤诊断结果发送至第三级管理单元;第三级管理单元基于接收到的过滤诊断结果生成并展示故障报文。本发明实现了采用分布式故障处理方式代替原有集中式故障处理方式,以分级并发方式实现了诊断数据的高效汇集。
-
公开(公告)号:CN110784368A
公开(公告)日:2020-02-11
申请号:CN201910846454.3
申请日:2019-09-09
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开了一种基于Memcached的数据采集系统及方法。本发明涉及的一种基于Memcached的数据采集系统,包括:数据层、业务层、表示层、底层;所述底层,与所述数据层连接,用于将底层的数据包发送至数据层;所述数据层,用于接收并存储底层发送的数据包;其中,所述数据层是基于Memcached实现的。所述业务层,与所述数据层连接,用于读取所述数据层中的数据包,并将所述读取的数据包发送至表示层;所述表示层,与所述业务层连接,用于接收所述业务层发送的数据包,并将接收到的数据展示给用户。
-
公开(公告)号:CN110597650A
公开(公告)日:2019-12-20
申请号:CN201910846463.2
申请日:2019-09-09
Applicant: 无锡江南计算技术研究所
Abstract: 一种计算机系统中基于自学习的并行故障定位方法及系统,属于高性能计算机维护技术领域。本发明的方法包括:查找故障点;并行对各个故障点的故障现象采用专家诊断模块进行诊断,若诊断有结果,则输出结果;否则采用智能诊断模块进行诊断,若诊断有结果,则输出诊断结果,并将故障现象及其诊断结果加入到专家诊断模块的故障库中。本发明的系统包括多个并行的分布式celery系统,分布式celery系统设有故障点查找模块,故障点查找模块连接有多个并行的单点故障诊断模块,单点故障诊断模块中包括专家诊断模块和智能诊断模块。本发明增强了高性能计算机系统的故障诊断维护能力,大大降低维护人员的工作难度。
-
-
-