一种基于知识熵的异常数据检测方法

    公开(公告)号:CN104376078A

    公开(公告)日:2015-02-25

    申请号:CN201410650726.X

    申请日:2014-11-14

    Applicant: 南京大学

    CPC classification number: G06F17/30598

    Abstract: 一种基于知识熵的异常数据检测方法,其特征在于包括如下步骤:1)样本集合的属性分析阶段:收集应用程序生成的数据样本集合U及其对应的属性集合A;对数据样本集U中的属性值进行规范化预处理;基于属性全集A对数据样本集U的作聚类处理,并计算A的知识熵;分别计算各个属性的重要度,据此构造属性集合的序列;结束。2)样本集合的数据样本检测阶段:计算每个数据样本的异常因子;根据异常因子输出异常数据集合;结束。本发明在利用聚类效果的同时避免聚类的不确定性,可以有效地保证异常数据的检测准确率。

Patent Agency Ranking