-
公开(公告)号:CN117909783A
公开(公告)日:2024-04-19
申请号:CN202311709286.6
申请日:2023-12-13
Applicant: 中南大学
IPC: G06F18/24 , G06F18/214 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于双向层次树网络的文本分类方法,包括获取带标签的文本分类数据集;针对获取的数据集进行构图处理,针对每个文本构建对应的依存分析图;采用针对每个文本构建的依存分析图,构造与带标签文本对应的编码树;采用构造的编码树,通过双向层次树网络学习处理,建立文本分类模型;采用建立的文本分类模型,针对未标记的待分类文本数据,完成文本分类处理;本发明方法通过结构熵最小化的编码树编码文本的语义信息,并使用双向层次树网络更新所有节点的隐藏特征;本发明的精度提高、实用性增强、模型简单且计算复杂度降低。