一种基于全息图平稳分布因子的离群点检测方法

    公开(公告)号:CN116186619A

    公开(公告)日:2023-05-30

    申请号:CN202211664344.3

    申请日:2022-12-23

    Applicant: 燕山大学

    Abstract: 本发明提出一种基于全息图平稳分布因子的离群点检测方法,属于数据挖掘技术领域。首先,使用相似度矩阵自适应的获取每个数据点的邻居集合来构造局部信息图;然后,引入最小生成树构造一个全局信息图;最后,利用局部信息图和全局信息图融合为全息图构造转移概率矩阵进行马尔可夫随机游走,通过生成的平稳分布检测出离群点。在人工数据集和真实数据集中,本发明的检测性能整体上均高于SUO、SUOD、IForest、HBOS对比算法。因此,本发明在离群点检测上有较好的应用前景。

    基于局部信息图标签传播的离群点检测方法

    公开(公告)号:CN116303660A

    公开(公告)日:2023-06-23

    申请号:CN202310025729.3

    申请日:2023-01-09

    Applicant: 燕山大学

    Abstract: 本发明公开了基于局部信息图标签传播的离群点检测方法,属于离群点检测技术领域,针对基于图标签传播的离群点检测方法存在只能检测全局离群点和检测精度不高等问题,本发明提出了一种基于局部信息图标签传播的离群点检测新方法。首先,由相互近邻的思想提出一种自适应获取参数k值的方法;其次,利用参数k和近邻关系构建局部近邻图,生成局部相似性矩阵和转移概率矩阵,再标记数据点并对其做标签传播,由离群点和内部点标签传播的收敛速度不同,统计每个点的收敛值差;最后,将每个数据点的收敛值差和相互近邻个数加权生成离群因子,进而检测出离群点。通过在人工数据集和真实数据集下的实验结果表明,该方法能有效且较好地检测出离群点。

    一种基于偏度和反内积的离群点检测方法

    公开(公告)号:CN115809434A

    公开(公告)日:2023-03-17

    申请号:CN202211514481.9

    申请日:2022-11-30

    Applicant: 燕山大学

    Abstract: 本发明涉及一种基于偏度和反内积的离群点检测方法,属于数据挖掘技术领域,首先通过向量的概念引入偏度,用于刻画数据对象在其邻域内的偏离程度。之后通过不同位置点的反内积的差异引入波动因子,衡量数据点的波动程度。最后将偏度与波动因子结合,作为波动离群因子检测离群点,结合了偏度与反内积的离群点检测方法可以很好的反映出离群点的变化程度。本发明不仅适用于各种分布的数据集,而且方法的稳定性十分高。

Patent Agency Ranking