一种在复杂噪声环境下的高度不平衡分类方法

    公开(公告)号:CN116010788A

    公开(公告)日:2023-04-25

    申请号:CN202310074895.2

    申请日:2023-01-18

    Abstract: 本发明公开了一种在复杂噪声环境下的高度不平衡分类方法,该方法包括4个步骤:1)将带有复杂噪声的样本集在三维特征空间中划分到两个正方体中;2)将每个正方体内部的样本点进行区域划分,从而得到分区样本点;3)为了弥补分区样本点的不足,引入了非安全样本点,以便于对划分后的特征空间进行曲线拟合;4)最后经由拟合而成的分类器对高度不平衡数据集进行随机欠采样得到平衡数据集用于分类模型的建立。本发明作为迄今为止第一个提出处理带有复杂噪声的高度不平衡数据集的分类器,不需要引入额外的参数,而且简单、高效、适用于任何场景;作为复杂噪声样本分类器,减少了数据冗余;作为高度不平衡数据分类器,有效地区分了多数类与少数类以及混合样本的边界,提高了模型的泛化能力。

Patent Agency Ranking