-
公开(公告)号:CN115730075A
公开(公告)日:2023-03-03
申请号:CN202211546281.1
申请日:2022-12-05
Applicant: 中电科大数据研究院有限公司
IPC: G06F16/35 , G06F40/242 , G06F40/284
Abstract: 本公开的实施例提供一种主题分类模型训练方法,具体实现方案为:获取待处理文本的初始词集合;对初始词集合进行关键词提取,得到至少一个关键词单元,每个关键词单元包括:至少一个关键词;基于至少一个关键词单元以及预设的主题分类标签矩阵,计算得到初始词集合的主题标签;基于初始词集合以及主题标签,训练得到主题分类模型。通过本实施方式,提高了主题标签标注的效率。