-
公开(公告)号:CN113837248A
公开(公告)日:2021-12-24
申请号:CN202111046551.8
申请日:2021-09-07
Applicant: 桂林理工大学
IPC: G06K9/62
Abstract: 本发明公开一种基于k近邻算法思想的近邻熵主动学习方法,融入了k近邻算法中“同类相聚,异类相离”的思想,包括:给定训练集和测试集,使用训练集训练分类器并利用这个分类器对测试集进行分类;遍历测试集,寻找与每一个未标记数据邻近的k个未标记数据;计算当前未标记数据及其邻近数据的熵值,以此得到该数据的近邻熵;由近邻熵值按从大到小的顺序对测试集排序,最后挑选出w个近邻熵值大的数据交给专家标记;更新训练集与测试集,利用更新后的训练集训练分类器;循环以上操作,直到满足停止条件。本发明可以使用尽量少的且信息量大的数据训练分类器,这样不仅避免挑选到既处于分类边界又是孤立点的数据,还减少了标记数据所需的代价。