一种基于汽车社区的文本自动分类方法

    公开(公告)号:CN117312561A

    公开(公告)日:2023-12-29

    申请号:CN202311270575.0

    申请日:2023-09-28

    Abstract: 本发明涉及一种基于汽车社区的文本自动分类方法,包括如下步骤:获取汽车社区文本的数据集;得到词向量和文本特征向量,作为双层聚类模型的输入值;对词向量和文本特征向量进行聚类计算分别生成词汇分类和文本分类,从而形成双层聚类模型。当新文本进入时:计算新文本的词向量和文本特征向量;计算新文本每个词向量的词汇分类,并计算每个分类下的词频;计算新文本的文本分类;根据新文本每个词向量的词汇分类、词频和文本分类进行动态分析,当新文本产生的现有词汇分类以外的词汇数量及词频达到阈值时,则更新双层聚类模型。因此本发明能够在全流程上实现对汽车社区文本的自动分类,提升分类准确性及效率,并形成闭环管理。

Patent Agency Ranking