-
公开(公告)号:CN116186619A
公开(公告)日:2023-05-30
申请号:CN202211664344.3
申请日:2022-12-23
Applicant: 燕山大学
IPC: G06F18/2415 , G06F18/20 , G06F16/26 , G06F17/16
Abstract: 本发明提出一种基于全息图平稳分布因子的离群点检测方法,属于数据挖掘技术领域。首先,使用相似度矩阵自适应的获取每个数据点的邻居集合来构造局部信息图;然后,引入最小生成树构造一个全局信息图;最后,利用局部信息图和全局信息图融合为全息图构造转移概率矩阵进行马尔可夫随机游走,通过生成的平稳分布检测出离群点。在人工数据集和真实数据集中,本发明的检测性能整体上均高于SUO、SUOD、IForest、HBOS对比算法。因此,本发明在离群点检测上有较好的应用前景。
-
公开(公告)号:CN117436020A
公开(公告)日:2024-01-23
申请号:CN202311460576.1
申请日:2023-11-03
Applicant: 燕山大学
IPC: G06F18/2433 , G06F18/2321
Abstract: 本发明公开了一种基于期望核密度离群因子的离群点检测方法,包括如下步骤;步骤1,输入初始数据集D和近邻参数k,为每个数据对象获取拓展邻域空间ENS(xi);步骤2,计算数据对象xi与数据对象xj之间的核带宽函数h(xj),通过核密度估计方法计算每个数据对象的局部密度;步骤3,针对初始数据集D,计算出期望k距离Ek_dist;在指定k值时,计算每个数据对象的期望距离Edist(xi);步骤4,计算每个数据对象的期望核密度离群因子EKDOF(xi);通过对期望核密度离群因子进行大小比较,输出n个离群点,本发明能够有效且较为全面的检测出离群点,提高检测精度。
-
公开(公告)号:CN114974589A
公开(公告)日:2022-08-30
申请号:CN202210657960.X
申请日:2022-06-10
Applicant: 燕山大学
Abstract: 本发明公开了一种宫颈癌预测方法,属于以大数据为基础的人工智能与医疗健康领域的交叉领域,包括对获取宫颈癌患者的特征属性数据进行预处理;基于已训练的MLP多层神经网络分类器作为预测模型;其中,训练过程具体为根据预处理后的数据集分为训练集与测试集,训练集转化成特征向量作为MLP多层神经网络的输入,进行训练;测试过程具体为通过测试集进行测试,选取最优的训练结果作为预测模型;通过预测模型对待预测者进行预测,输出宫颈癌的预测结果;本发明相对于医院做细胞学检测而言,更加简单快捷。
-
公开(公告)号:CN117520980A
公开(公告)日:2024-02-06
申请号:CN202311461387.6
申请日:2023-11-03
Applicant: 燕山大学
IPC: G06F18/2433 , G06F18/2135
Abstract: 本发明公开了一种基于局部稀疏因子的离群点检测方法,属于离群点检测技术领域,针对维度灾难对基于邻近性算法的影响,首先使用主成分分析法获取数据集中不相关程度较高的属性,当属性的累积贡献度超过指定的阈值时,认定其为主成分,使用加权主成分距离替代欧式距离以衡量数据点之间的邻近程度。此外,定义了局部稀疏因子进一步刻画数据的离群程度,并定义离群分数综合局部和全局角度刻画数据的离群程度,进而提出了基于局部稀疏因子的离群点检测方法,并通过实验验证了本发明相对于现有方法在离群点检测领域具有更高的准确程度。
-
公开(公告)号:CN116303660A
公开(公告)日:2023-06-23
申请号:CN202310025729.3
申请日:2023-01-09
Applicant: 燕山大学
IPC: G06F16/2458 , G06F18/2413
Abstract: 本发明公开了基于局部信息图标签传播的离群点检测方法,属于离群点检测技术领域,针对基于图标签传播的离群点检测方法存在只能检测全局离群点和检测精度不高等问题,本发明提出了一种基于局部信息图标签传播的离群点检测新方法。首先,由相互近邻的思想提出一种自适应获取参数k值的方法;其次,利用参数k和近邻关系构建局部近邻图,生成局部相似性矩阵和转移概率矩阵,再标记数据点并对其做标签传播,由离群点和内部点标签传播的收敛速度不同,统计每个点的收敛值差;最后,将每个数据点的收敛值差和相互近邻个数加权生成离群因子,进而检测出离群点。通过在人工数据集和真实数据集下的实验结果表明,该方法能有效且较好地检测出离群点。
-
公开(公告)号:CN115828123A
公开(公告)日:2023-03-21
申请号:CN202211557093.9
申请日:2022-12-06
Applicant: 燕山大学
IPC: G06F18/2321 , G06F18/23211
Abstract: 本发明公开了一种基于快速密度峰值聚类离群因子的离群点检测方法,属于离群点检测技术领域,包括以下步骤:S1、输入初始数据集D,近邻参数k,聚类数目c;S2、通过快速密度峰值聚类方法对数据集D进行聚类,输出c个聚类;S3、计算数据对象xi快速密度峰值聚类离群因子FOFi;S4、将快速密度峰值聚类离群因子FOFi降序排列,并输出快速密度峰值聚类离群因子FOFi排序位于前o的点作为离群点。本发明拥有稳定的离群点检测效率和优异的运行效率,能够稳定高效的检测出离群点。
-
公开(公告)号:CN115809434A
公开(公告)日:2023-03-17
申请号:CN202211514481.9
申请日:2022-11-30
Applicant: 燕山大学
IPC: G06F18/2433 , G06F18/2413
Abstract: 本发明涉及一种基于偏度和反内积的离群点检测方法,属于数据挖掘技术领域,首先通过向量的概念引入偏度,用于刻画数据对象在其邻域内的偏离程度。之后通过不同位置点的反内积的差异引入波动因子,衡量数据点的波动程度。最后将偏度与波动因子结合,作为波动离群因子检测离群点,结合了偏度与反内积的离群点检测方法可以很好的反映出离群点的变化程度。本发明不仅适用于各种分布的数据集,而且方法的稳定性十分高。
-
-
-
-
-
-