文本分类模型的训练、文本分类方法及装置

    公开(公告)号:CN119166820A

    公开(公告)日:2024-12-20

    申请号:CN202411329495.2

    申请日:2024-09-23

    Abstract: 本说明书实施例提供一种文本分类模型的训练、文本分类方法及装置,在文本分类模型的训练方法中,获取训练集,将任意的第一训练文本输入文本分类模型,通过其中的主分类网络和m个附加分类网络分别得到1个主概率和m个附加概率。根据各训练文本各自的m个附加概率,从训练集中选取出各确信文本形成确信集。基于各确信文本的预测损失,从确信集中逐类别选取对应数目阈值的目标文本,形成第一干净集,基于确信集中除目标文本外的其他确信文本形成第一噪声集。利用大模型,基于第一干净集,获得各第一噪声文本的预测标签。根据各第一噪声文本及其预测标签,以及各第一干净文本及其类别标签,训练文本分类模型。

Patent Agency Ranking