-
公开(公告)号:CN114362973B
公开(公告)日:2023-02-28
申请号:CN202011031765.3
申请日:2020-09-27
Applicant: 中国科学院软件研究所
IPC: H04L9/40 , G06F18/23213
Abstract: 本发明提供一种结合K‑means和FCM聚类的流量检测方法及电子装置,包括通过已标注流量数据集Tq及标注种类确定的kq个聚类cq,i及各聚类cq,i的簇心,对包含已标注流量数据集Tq与未标注流量数据集Wq的数据集D进行聚类,得到聚类c′q,i;若聚类c′q,i的离群点数据满足一设定规则,得到k′q个聚类Cq,j;依据聚类cq,j,计算数据集D中各数据的标注结果,获取已标注流量数据集Tq+1与未标注流量数据集Wq+1;依据未标注流量数据集W1在聚类cQ,j中各数据的标注种类KQ,对未标注流量数据集W1进行分类。本发明实现了K‑means算法中k值的自我调节,更容易达到全局最优;利用自训练模式,避免错误数据在后续的迭代中累积;实现了标记数据集和未标记数据集的动态变化,具有实时性和灵活性。
-
公开(公告)号:CN114362973A
公开(公告)日:2022-04-15
申请号:CN202011031765.3
申请日:2020-09-27
Applicant: 中国科学院软件研究所
Abstract: 本发明提供一种结合K‑means和FCM聚类的流量检测方法及电子装置,包括通过已标注流量数据集Tq及标注种类确定的kq个聚类cq,i及各聚类cq,i的簇心,对包含已标注流量数据集Tq与未标注流量数据集Wq的数据集D进行聚类,得到聚类c′q,i;若聚类c′q,i的离群点数据满足一设定规则,得到k′q个聚类Cq,j;依据聚类cq,j,计算数据集D中各数据的标注结果,获取已标注流量数据集Tq+1与未标注流量数据集Wq+1;依据未标注流量数据集W1在聚类cQ,j中各数据的标注种类KQ,对未标注流量数据集W1进行分类。本发明实现了K‑means算法中k值的自我调节,更容易达到全局最优;利用自训练模式,避免错误数据在后续的迭代中累积;实现了标记数据集和未标记数据集的动态变化,具有实时性和灵活性。
-