一种基于信息熵加权的局部离群检测方法

    公开(公告)号:CN110288014A

    公开(公告)日:2019-09-27

    申请号:CN201910540443.2

    申请日:2019-06-21

    Abstract: 本发明公开了一种基于信息熵加权的局部离群检测方法,首先,预先获取属性为离群属性的样本数据,并设置离群属性权值;其次求出熵权距离;根据熵权距离找出每个样本数据距离最近的k个数据;然后,计算每个样本数据的k近邻距离dr和平均距离Dr;最后计算每个样本数据的局部离群因子eldof(r)。本发明在LDOF算法的基础上增加了熵权信息,即在计算距离时采用熵的加权距离,使得离群数据检测的准确率提高,同时产生一定的时间开销,在检测时不需事先了解数据分布,不依赖达到一定数量和要求的训练集等,有效提高了算法检测精度。

Patent Agency Ranking