-
公开(公告)号:CN111209131A
公开(公告)日:2020-05-29
申请号:CN201911390574.3
申请日:2019-12-30
Applicant: 航天信息股份有限公司广州航天软件分公司
IPC: G06F11/07
Abstract: 本发明提供一种基于机器学习确定异构系统的故障的方法和系统,其通过对历史的系统故障和重大事件的安全进行分析,初步建立案例库数据和故障树模型,并整理分析指标数据和标注数据,分别训练不同使用场景的数据模型;根据采集到的当前指标数据以及数据模型,计算分析系统运行健康状况以及对抓取到的异常指标数据触发故障诊断和告警;根据机器学习建立的关系图谱以及采集的异常堆栈标注数据,自动诊断出故障原因,并根据故障原因确定故障修复方案,触发故障修复。所述方法和系统降低了运维人员对业务专业知识的依赖,通过机器学习实现智能快速发现故障并诊断故障产生的原因,自动完成自我修复,大大提高了分布工异构系统运行的安全性和稳定性。
-
公开(公告)号:CN111209131B
公开(公告)日:2024-05-14
申请号:CN201911390574.3
申请日:2019-12-30
Applicant: 航天信息股份有限公司广州航天软件分公司
IPC: G06F11/07
Abstract: 本发明提供一种基于机器学习确定异构系统的故障的方法和系统,其通过对历史的系统故障和重大事件的安全进行分析,初步建立案例库数据和故障树模型,并整理分析指标数据和标注数据,分别训练不同使用场景的数据模型;根据采集到的当前指标数据以及数据模型,计算分析系统运行健康状况以及对抓取到的异常指标数据触发故障诊断和告警;根据机器学习建立的关系图谱以及采集的异常堆栈标注数据,自动诊断出故障原因,并根据故障原因确定故障修复方案,触发故障修复。所述方法和系统降低了运维人员对业务专业知识的依赖,通过机器学习实现智能快速发现故障并诊断故障产生的原因,自动完成自我修复,大大提高了分布工异构系统运行的安全性和稳定性。
-