-
公开(公告)号:CN119025674A
公开(公告)日:2024-11-26
申请号:CN202410994764.0
申请日:2024-07-24
Applicant: 中移(苏州)软件技术有限公司 , 中国移动通信集团有限公司
IPC: G06F16/35 , G06F18/24 , G06F18/22 , G06N3/0455 , G06N3/08
Abstract: 本申请提供一种文本分类模型的训练方法、文本分类方法及相关设备,所述文本分类模型包括编码器和解码器,所述方法包括:获取训练数据集,所述训练数据集包括训练文本、所述训练文本对应的第一标签和所述第一标签对应的标签扩充信息,所述标签扩充信息为对所述第一标签内容的描述信息;对所述文本分类模型进行训练,得到目标文本分类模型。本申请通过对文本分类模型中的编码器和解码器利用训练文本、训练文本对应的第一标签和第一标签对应的标签扩充信息进行训练,得到目标文本分类模型,从而提高了对文本的分类效率。
-
公开(公告)号:CN119740118A
公开(公告)日:2025-04-01
申请号:CN202411799186.1
申请日:2024-12-09
Applicant: 中移(苏州)软件技术有限公司 , 中国移动通信集团有限公司
IPC: G06F18/2415 , G06F18/22 , G06F18/2321 , G06F18/213 , G06F18/25 , G06F40/30
Abstract: 本发明提供一种长文本分类方法、装置、设备、介质及程序产品,该方法包括:在目标长文本中随机添加第一标记和第二标记对目标长文本进行分割,将目标长文本分为前中后三部分;对目标长文本分的前中后三部分的文本进行处理,得到目标短文本,组成句子片段集合;获取得到所有目标短文本的处理过程中形成的长文本分割层次;根据句子片段集合和长文本分割层次,得到长文本图结构及其对应的长文本图向量;根据目标短文本的子标签,得到标签图结构及其对应的标签图向量;将长文本图结构及其对应的长文本图向量与标签图结构及其对应的标签图向量进行对比匹配,确定长文本的分类结果。本发明中,通过层次填充分割,有效准确的分割长文本。
-