-
公开(公告)号:CN119691524A
公开(公告)日:2025-03-25
申请号:CN202411907023.0
申请日:2024-12-24
Applicant: 大连理工大学
Abstract: 本发明属于不平衡数据分类领域,涉及一种基于多层选择双准则评价机制的遗传编程文本数据过采样方法。本方法首先针对现有不平衡数据集进行划分操作,计算出需要生成的样本数量,并得到目标多数类以及目标少数类。然后需要设计遗传编程的演化过程,每个子种群利用设计好的演化过程,独立演化目标样本;适应度函数采用基于距离与角度的双准则评价函数,选择算子采用基于锦标赛选择法改进的适用于双准则评价的选择算法;子种群演化的目标为获得最佳的合成实例。然后从每个演化后的子种群中选择出一个最佳个体作为合成实例,最后将选择的个体与原始数据集组合得到一个完整的平衡数据集。