-
公开(公告)号:CN116578927A
公开(公告)日:2023-08-11
申请号:CN202310532903.3
申请日:2023-05-11
Applicant: 浙江工业大学
IPC: G06F18/2413 , G06N20/00 , G06F18/2321
Abstract: 本发明公开了一种基于核密度估计与香农熵的风电机组数据异常检测方法,基于马氏距离,寻找到每个数据点的邻居点,之后利用以高斯函数为核函数的核密度估计方法,对所有的数据进行密度估计。结合邻居点和密度估计值,计算出了以每个点为中心的局部熵值,局部熵值可以用来衡量局部点的密度是否均匀,可以用来更高效地检测集群异常。之后,将每个点的局部熵值除以每个点的密度估计值,得到熵密度比。熵密度比越高,说明局部熵值越高,说明当前局部的密度较为分散,同时,也表明当前点的密度值较小,说明当前点出现的概率低,由此可以判断为异常点。本发明可以精准高效地检测出多维数据集中的异常点。