文本聚类方法、装置及计算机设备

    公开(公告)号:CN110866097A

    公开(公告)日:2020-03-06

    申请号:CN201911030513.6

    申请日:2019-10-28

    Inventor: 曹绍升 张赏

    Abstract: 本说明书实施例提供一种文本聚类方法、装置及计算机设备。在进行文本聚类时,从文本中提取出字符片段作为文本的特征,并基于提取的字符片段在文本出现的次数构建文本的特征矩阵,然后基于构建的特征矩阵对文本进行聚类。由于直接在字符粒度提取文本特征,不需要进行分词,非常适合新产生的客服问题句子,一定程度解决了新词语、新句式多造成传统的分词准确度低的难题,可以避免误分词影响文本聚类的准确性。

Patent Agency Ranking