-
公开(公告)号:CN114860929A
公开(公告)日:2022-08-05
申请号:CN202210435127.0
申请日:2022-04-24
Applicant: 安徽理工大学
IPC: G06F16/35 , G06F40/289 , G06F40/253 , G06F40/242 , G06F16/903 , G06N3/04
Abstract: 本发明提供了一种基于改进TextCNN的新闻文本分类方法,改进后的TextCNN包括输入层,卷积池化层,输出层。输入层:通过词向量word embeddings将词转化成词向量,利用全局注意力机制对词向量中的每个元素进行权重赋值,从而突出显著特征抑制无用特征。卷积池化层:一共有三种规格的卷积核,大小分别为2、3、4,卷积核的数量是256,卷积核的宽度为词向量大小,池化层融合了平均池化和最大池化操作,使用MLP层进一步提取平均池化和最大池化产生的特征,提升特征的全局表示能力。输出层:池化层的向量输入到全连接层中,最后经过softsign激活后得到最终的词向量表示特征,输出为维度为10向量,向量的每一个维度对应一个类别。该方法有利于提高新闻文本分类的准确率。