-
公开(公告)号:CN111078887A
公开(公告)日:2020-04-28
申请号:CN201911326228.9
申请日:2019-12-20
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06F16/35 , G06F40/279 , G06F40/242 , G06N3/04 , G06N3/08
Abstract: 本申请实施例公开了文本分类方法和装置。该方法的一具体实施方式包括:获取待分类文本;对待分类文本进行分词,得到词语列表;对待分类本文中的文字进行声调划分,得到声调组合列表;确定词语列表中的每个词语的词向量,以及确定声调组合列表中的每个声调组合的声调向量;将所得到的词向量和声调向量输入预先训练的文本分类模型,得到用于表征待分类文本的类别的标签。该实施方式实现了将词向量和声调向量相结合,从词和声调两个维度分别提取文本的语义和语调特征,使用这些特征可以有效地改善字/词级特征存在的不足,提高文本分类的准确性。