-
公开(公告)号:CN109218114B
公开(公告)日:2021-06-08
申请号:CN201811340364.9
申请日:2018-11-12
Applicant: 西安微电子技术研究所
IPC: H04L12/24
Abstract: 本发明公开了一种基于决策树的服务器故障自动检测系统及检测方法,结合专家系统和IPMI管理单元结合生成历史数据集;通过IPMI管理单元获得故障时服务器运行状态数据,即异常数据流,根据异常数据流提取新故障特征向量,将新特征向量与故障原因关系对组成故障数据集,并将其训练成自诊断决策树模型;当服务器运行过程中发生故障时,提取对应的故障特征向量,由自诊断决策树模型自动判断故障类型、原因和处理方法并通知技术人员,在故障清除后,再将该故障特征向量和故障原因关系对加入历史故障集完成更新,并更新自诊断故障树模型,因而随着历史故障集的不断完善,故障诊断系统将会更加准确、可靠。
-
公开(公告)号:CN109542691A
公开(公告)日:2019-03-29
申请号:CN201811340334.8
申请日:2018-11-12
Applicant: 西安微电子技术研究所
Abstract: 本发明公开了一种提高IPMI管理软件可靠性的方法,机箱上电后,对IPMI管理软件的机箱管理模块Shelf Manager与所有刀片的IPMC模块上电,机箱管理模块采用shell脚本语言控制被管理刀片的负载按次序上电;然后,ATCA Board被管刀片通过两条IPMB总线,定时按照自定义IPMI组扩展协议向机箱管理模块Shelf Manager发送链路状态信息的请求,对链路进行判断;当检测到机箱管理软件与被管理刀片之间的链路正常,则进行正常的IPMI消息通讯,接收机箱管理软件的请求,进行解析并按照请求消息回复相应的响应消息,同时,对被管刀片异常情况,通过事件消息主动向机箱管理软件上报。本发明提高了IPMI管理软件的可靠性,提高服务器故障维修效率,保证服务器持续稳定运行。
-
公开(公告)号:CN109446153A
公开(公告)日:2019-03-08
申请号:CN201811321065.0
申请日:2018-11-07
Applicant: 西安微电子技术研究所
Abstract: 本发明提供一种大容量固态存储刀片,包括CPU模块、存储模块、接口模块和电源模块;CPU处理模块用于提供数据存储、带宽接口资源和计算功能,包括两个处理器,两个处理器通过非透明桥的方式连接;存储模块用于存储数据;接口模块用于提供对外接口;电源模块为各功能模块提供电源。本发明中的CPU模块,采用基于非透明桥方法的双处理器桥接形式,能够有效提高处理器计算能力;以两个处理器为核心,为整个刀片提供大容量数据存储、丰富的带宽接口资源和强大的计算能力;两个处理器通过非透明桥的方式连接,相比于单个处理器,性能大幅提升,适用于雷达、信息处理领域。
-
公开(公告)号:CN109218114A
公开(公告)日:2019-01-15
申请号:CN201811340364.9
申请日:2018-11-12
Applicant: 西安微电子技术研究所
IPC: H04L12/24
Abstract: 本发明公开了一种基于决策树的服务器故障自动检测系统及检测方法,结合专家系统和IPMI管理单元结合生成历史数据集;通过IPMI管理单元获得故障时服务器运行状态数据,即异常数据流,根据异常数据流提取新故障特征向量,将新特征向量与故障原因关系对组成故障数据集,并将其训练成自诊断决策树模型;当服务器运行过程中发生故障时,提取对应的故障特征向量,由自诊断决策树模型自动判断故障类型、原因和处理方法并通知技术人员,在故障清除后,再将该故障特征向量和故障原因关系对加入历史故障集完成更新,并更新自诊断故障树模型,因而随着历史故障集的不断完善,故障诊断系统将会更加准确、可靠。
-
-
-