一种中医舌色噪声标注样本的自动识别与清洗方法

    公开(公告)号:CN114037011B

    公开(公告)日:2024-05-28

    申请号:CN202111316442.3

    申请日:2021-11-08

    Abstract: 本发明公开了一种中医舌色噪声标注样本的自动识别与清洗方法,通过对比预测标签与人工标注标签的概率关系,采用两种不同的筛选策略,实现对舌色噪声标注数据的准确、自动识别与清洗。本发明将人工标注标签称为硬标签,将通过模型得到的标签预测概率称为软标签,将预测概率最大值对应的标签称为伪标签。本发明利用深度网络模型进行样本标签的预测,进而进行噪声样本的自动识别和筛选,结果更加客观、准确。另外,整个过程没有专家的参与,不需要耗费人力,同时降低了人为带来噪声的可能性,提高了噪声标注样本识别的准确率;在模型训练前进行数据集的处理,使得处理后的数据集可以适用于其他分类模型。

    一种中医舌色噪声标注样本的自动识别与清洗方法

    公开(公告)号:CN114037011A

    公开(公告)日:2022-02-11

    申请号:CN202111316442.3

    申请日:2021-11-08

    Abstract: 本发明公开了一种中医舌色噪声标注样本的自动识别与清洗方法,通过对比预测标签与人工标注标签的概率关系,采用两种不同的筛选策略,实现对舌色噪声标注数据的准确、自动识别与清洗。本发明将人工标注标签称为硬标签,将通过模型得到的标签预测概率称为软标签,将预测概率最大值对应的标签称为伪标签。本发明利用深度网络模型进行样本标签的预测,进而进行噪声样本的自动识别和筛选,结果更加客观、准确。另外,整个过程没有专家的参与,不需要耗费人力,同时降低了人为带来噪声的可能性,提高了噪声标注样本识别的准确率;在模型训练前进行数据集的处理,使得处理后的数据集可以适用于其他分类模型。

    一种基于元学习的中医舌色域自适应分类方法

    公开(公告)号:CN115457310A

    公开(公告)日:2022-12-09

    申请号:CN202211009174.5

    申请日:2022-08-22

    Abstract: 本发明公开了一种基于元学习的中医舌色域自适应分类方法,包括构建源域和目标域舌色分类数据集、基于元学习的源域舌色分类网络训练、目标域网络模型微调与高质量伪标签生成、目标域舌色分类模型训练。使用ResNet18作为分类骨干网络,利用源域的有标注数据构建元训练和元测试任务;使用目标域少量标注样本对源域预训练的模型进行微调。利用微调后的模型对目标域的未标注数据进行分类,将分类预测结果作为伪标签。挑选出高质量的伪标签,作为标注数据,对目标域的分类模型进行微调,得到目标域的舌色分类模型,得到一个高精度的目标域舌色分类模型。本方法大大减少了模型的参数量,使模型易于训练和使用,具有良好的实际应用价值。

Patent Agency Ranking