基于K-means改进的SMOTE算法

    公开(公告)号:CN110852388A

    公开(公告)日:2020-02-28

    申请号:CN201911104691.9

    申请日:2019-11-13

    Applicant: 吉林大学

    Abstract: 本发明公开了一种基于K-means改进的SMOTE算法,该改进算法改进了现有SMOTE算法不能消除噪声样本、无法确定建模效果的偏差、无法解决非平衡数据的分布问题、容易产生分布边缘化问题、对于边缘的少类样本,对其进行K近邻生成样本也位于边缘且会越来越边缘化,使得正负样本的边界越来越模糊的上述问题,为处理不平衡数据集提供了新的方法。

Patent Agency Ranking