-
公开(公告)号:CN117743004A
公开(公告)日:2024-03-22
申请号:CN202311576916.7
申请日:2023-11-23
Applicant: 重庆邮电大学
IPC: G06F11/07 , G06F18/243 , G06F18/214 , G06F18/213 , G06N20/20 , G06F123/02
Abstract: 本发明涉及机器学习和数据挖掘技术领域,具体涉及一种基于多源类别不平衡数据的系统故障检测方法,包括:获取系统中每个服务器的多源时序数据,根据多源时序数据得到初始数据集;对初始数据集进行特征工程,得到结构化数据集;使用标签特定距离度量算法对结构化数据集进行处理,得到实例集合和近邻实例集合;通过多标签分层抽样方法对结构化数据集进行划分,得到训练集和测试集;对实例集合和近邻实例集合进行采样,得到采样训练集;建立分类器链模型,将采样训练集输入分类器链模型进行训练,得到训练好的分类器链模型;本发明通过标签特定采样方法,有效地平衡各个故障源的实例数量,确保每个故障类别在训练过程中都能得到充分的关注。