一种面向高性能计算系统的异常检测方法及系统

    公开(公告)号:CN119166450A

    公开(公告)日:2024-12-20

    申请号:CN202410971838.9

    申请日:2024-07-19

    Abstract: 本发明公开了一种面向高性能计算系统的异常检测方法及系统,本发明的方法包括获取计算系统中计算结点对应的监控指标切分后的数据片段;提取数据片段的特征向量,并对特征向量进行聚类得到聚类簇;利用数据片段中靠近聚类簇质心的部分数据片段训练共享模型,以得到训练好的共享模型;利用提取的实时的监控指标的特征与聚类簇进行模式匹配,并根据模式匹配结果利用训练好的共享模型检测目标结点中的异常数据以得到异常数据检测结果。本发明能够及时的检测到高性能计算系统中结点的异常数据,保证异常检测的准确性。

    微服务故障检测方法、装置、存储介质及计算机设备

    公开(公告)号:CN115357418A

    公开(公告)日:2022-11-18

    申请号:CN202210705260.3

    申请日:2022-06-21

    Applicant: 南开大学

    Abstract: 本发明公开了一种微服务故障检测方法、装置、存储介质及计算机设备,主要在于能够提高微服务故障的检测精度。其中包括:获取微服务系统在各时间窗口下的多模态数据;对所述多模态数据分别进行异常检测,得到所述各时间窗口下多模态数据分别对应的异常事件;根据所述多模态数据分别对应的异常事件,确定所述各时间窗口下的异常事件序列;对所述异常事件序列进行特征提取,得到所述异常特征向量;将所述异常特征向量输入至预设故障检测模型中进行故障检测,得到所述微服务系统的故障检测结果。

    基于图卷积神经网络的微服务故障诊断方法、装置及设备

    公开(公告)号:CN115309575A

    公开(公告)日:2022-11-08

    申请号:CN202210736465.8

    申请日:2022-06-27

    Applicant: 南开大学

    Abstract: 本发明公开了一种基于图卷积神经网络的微服务故障诊断方法、装置及设备,主要在于能够快速、准确的定位出根因微服务节点,以及判断出微服务故障类型。其中方法包括:采集待诊断的目标微服务在故障前后预设时间段内的告警事件,其中,所述告警事件是基于多模态数据产生的;根据所述告警事件确定所述目标微服务中各微服务节点的告警事件序列;生成所述告警事件序列中各个告警事件的事件向量,基于所述事件向量计算所述各个告警事件所对应微服务节点的节点向量;将各微服务节点的所述节点向量输入训练完成的故障诊断模型,获取故障诊断结果,所述故障诊断结果至少包括根因微服务节点的定位结果以及微服务故障类型的预测结果。

Patent Agency Ranking