-
公开(公告)号:CN112070171A
公开(公告)日:2020-12-11
申请号:CN202010953102.0
申请日:2020-09-11
Applicant: 桂林理工大学
IPC: G06K9/62
Abstract: 本发明公开了一种基于实例选择和特征选择的优化数据集的方法。该方法先用基于Jaccard索引的Relief‑F算法筛选出数据集中高质量的实例集,然后对筛选后的实例集运用Relief‑F算法再对数据集的特征进行筛选。实验结果证明我们提出的数据集预处理方法与传统的数据集预处理方法和最新的数据集预处理方法相比,该方法不仅可以有效地降低数据集中冗余的实例和特征,而且提高了数据集分类的精确度。