一种基于聚类模型的高维数据流离群点检测方法

    公开(公告)号:CN105868266A

    公开(公告)日:2016-08-17

    申请号:CN201610055727.9

    申请日:2016-01-27

    CPC classification number: G06F16/2465 G06F16/285

    Abstract: 本发明属于数据挖掘算法在高维数据流处理领域的应用,特别涉及到一种基于聚类模型的高维数据流离群点检测方法。该方法首先通过样本数据流进行聚类,再分析聚类结果中每一个簇的特征维,在计算测试数据集属于哪个簇的时候,只计算与该簇特征维相关的属性,忽略吊冗余属性的计算,从而有效的降低了计算量。如果发现某个数据点不属于任何簇,该点将形成新的簇,如果某个簇长时间没有吸收新的数据点且该簇的数据点个数很少,那么该簇即是包含离群点的簇。本发明具有在高维数据流离群点检测时的效率和准确率都比传统的基于滑动窗口的离群点检测算法要高的技术效果。

Patent Agency Ranking