-
公开(公告)号:CN111695610A
公开(公告)日:2020-09-22
申请号:CN202010458674.1
申请日:2020-05-26
Applicant: 东南大学
IPC: G06K9/62
Abstract: 本发明公开了一种基于多分类器集成的半监督识别方法。首先,初始化样本集,将样本集中的样本分为有标记样本和未标记样本;其次,利用有标记样本集训练基分类器;再次,分类未标记样本,计算对应置信值CZ,用基分类器的分类准确率更新权重参数进入循环;之后,判断CZ与阈值λ关系,为未标记样本打标;然后,判断是否达到迭代终止条件;最后,完成分类,未标记样本获得类别标记。本发明通过构建有效的基分类器、引入置信值参数和设置提前终止条件的方式提升分类性能,克服了协同训练算法有效视图不易生成、迭代过程引入噪声使识别效果变差的问题。与协同训练算法相比,本发明在标记样本有限的条件下能达到较好的识别效果。
-
公开(公告)号:CN111695612A
公开(公告)日:2020-09-22
申请号:CN202010459153.8
申请日:2020-05-26
Applicant: 东南大学
IPC: G06K9/62
Abstract: 本发明公开了一种基于聚类的半监督识别方法。首先,初始化样本集,将样本集中的样本分为有标记样本和未标记样本,并根据有标记样本的类别标签初始化各类别中心;其次,计算未标记样本到各类别中心的余弦距离,确定距离最近的类别中心,进入循环;再次,计算未标记样本的Z-Score值,确定其类别归属;然后,判断是否达到迭代终止条件;最后,完成聚类,未标记样本均获得类别标记。本发明通过选取余弦距离作为距离衡量标准,引入Z-Score值进行相似性度量的方式对约束种子k均值算法进行改进。与约束种子k均值算法相比,改进后的算法在物联网设备识别中具备更好的聚类效果和新类别发现能力。
-