基于多标签关联的文本分类方法、系统、设备及介质

    公开(公告)号:CN118227790A

    公开(公告)日:2024-06-21

    申请号:CN202410335568.2

    申请日:2024-03-22

    Abstract: 本发明公开了基于多标签关联的文本分类方法、系统、设备及介质,其中方法包括:获取已知标签类别的多个文本,构建训练集和测试集;所述训练集和测试集,包括:多个文本和多个标签类别,其中,每个文本的已知标签类别为多个;将训练集分为两部分:第一训练子集和第二训练子集;将第一训练子集中的每个文本和多个标签类别,输入到文本分类模型中,对模型进行训练,得到初步训练后的文本分类模型;将第二训练子集中的每个文本和多个标签类别,输入到初步训练后的文本分类模型,对模型进行训练,得到最终训练后的文本分类模型;根据测试集,对最终训练后的文本分类模型进行测试,利用通过测试的网络模型对待分类文本进行分类。

Patent Agency Ranking