-
公开(公告)号:CN119166820A
公开(公告)日:2024-12-20
申请号:CN202411329495.2
申请日:2024-09-23
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/35 , G06F16/33 , G06N3/0455 , G06N3/084
Abstract: 本说明书实施例提供一种文本分类模型的训练、文本分类方法及装置,在文本分类模型的训练方法中,获取训练集,将任意的第一训练文本输入文本分类模型,通过其中的主分类网络和m个附加分类网络分别得到1个主概率和m个附加概率。根据各训练文本各自的m个附加概率,从训练集中选取出各确信文本形成确信集。基于各确信文本的预测损失,从确信集中逐类别选取对应数目阈值的目标文本,形成第一干净集,基于确信集中除目标文本外的其他确信文本形成第一噪声集。利用大模型,基于第一干净集,获得各第一噪声文本的预测标签。根据各第一噪声文本及其预测标签,以及各第一干净文本及其类别标签,训练文本分类模型。