一种基于局部稀疏因子的离群点检测方法

    公开(公告)号:CN117520980A

    公开(公告)日:2024-02-06

    申请号:CN202311461387.6

    申请日:2023-11-03

    Applicant: 燕山大学

    Abstract: 本发明公开了一种基于局部稀疏因子的离群点检测方法,属于离群点检测技术领域,针对维度灾难对基于邻近性算法的影响,首先使用主成分分析法获取数据集中不相关程度较高的属性,当属性的累积贡献度超过指定的阈值时,认定其为主成分,使用加权主成分距离替代欧式距离以衡量数据点之间的邻近程度。此外,定义了局部稀疏因子进一步刻画数据的离群程度,并定义离群分数综合局部和全局角度刻画数据的离群程度,进而提出了基于局部稀疏因子的离群点检测方法,并通过实验验证了本发明相对于现有方法在离群点检测领域具有更高的准确程度。

    一种基于偏度和反内积的离群点检测方法

    公开(公告)号:CN115809434A

    公开(公告)日:2023-03-17

    申请号:CN202211514481.9

    申请日:2022-11-30

    Applicant: 燕山大学

    Abstract: 本发明涉及一种基于偏度和反内积的离群点检测方法,属于数据挖掘技术领域,首先通过向量的概念引入偏度,用于刻画数据对象在其邻域内的偏离程度。之后通过不同位置点的反内积的差异引入波动因子,衡量数据点的波动程度。最后将偏度与波动因子结合,作为波动离群因子检测离群点,结合了偏度与反内积的离群点检测方法可以很好的反映出离群点的变化程度。本发明不仅适用于各种分布的数据集,而且方法的稳定性十分高。

Patent Agency Ranking