-
公开(公告)号:CN114969343A
公开(公告)日:2022-08-30
申请号:CN202210639693.3
申请日:2022-06-07
Applicant: 重庆邮电大学
IPC: G06F16/35 , G06F40/216 , G06F40/30
Abstract: 本发明涉及一种结合相对位置信息的弱监督文本分类方法,属于自然语言处理领域,包括以下步骤:S1:输入初始化种子词,以及与初始化种子词同类的为标记文档;S2:生成伪标签;S3:基于生成的伪标签训练Transformer文本分类器;S4:通过文本分类器为未标记的文本分配标签;S5:通过比较排序方法,更新每一个类别的种子词,返回步骤S2进行迭代训练。本发明提升了模型的学习能力,提高了分类的准确率。
-
公开(公告)号:CN114969343B
公开(公告)日:2024-04-19
申请号:CN202210639693.3
申请日:2022-06-07
Applicant: 重庆邮电大学
IPC: G06F16/35 , G06F40/216 , G06F40/30
Abstract: 本发明涉及一种结合相对位置信息的弱监督文本分类方法,属于自然语言处理领域,包括以下步骤:S1:输入初始化种子词,以及与初始化种子词同类的为标记文档;S2:生成伪标签;S3:基于生成的伪标签训练Transformer文本分类器;S4:通过文本分类器为未标记的文本分配标签;S5:通过比较排序方法,更新每一个类别的种子词,返回步骤S2进行迭代训练。本发明提升了模型的学习能力,提高了分类的准确率。
-