一种基于图神经网络主题模型的文本分类方法

    公开(公告)号:CN114186062B

    公开(公告)日:2025-05-02

    申请号:CN202111521453.5

    申请日:2021-12-13

    Applicant: 安徽大学

    Inventor: 叶凡 徐善泽

    Abstract: 本发明公开了一种基于图神经网络主题模型的文本分类方法,包括:1、对文本进行预处理;2、将文本中的各个词表示成两种词向量形式;3、对用单词袋表示的词向量,使用神经主题模型(NVDM‑GSM)得到文本的主题分布和主题向量;4、对用Glove模型表示的词向量,以文本中的单词为结点构建图结构,对图的每个结点使用门控图神经网络来获取结点的邻接信息;5、对结点间使用注意力机制;6、利用Softmax分类器对训练后的文档图进行分类。本发明不仅考虑文档中的单词对上下文依赖的特点,还引入注意力机制来权衡不同单词的重要性,并用文档的主题分布和主题向量从全局的角度来指导注意力机制,从而更好的对文本进行分类。

    一种基于图神经网络主题模型的文本分类方法

    公开(公告)号:CN114186062A

    公开(公告)日:2022-03-15

    申请号:CN202111521453.5

    申请日:2021-12-13

    Applicant: 安徽大学

    Inventor: 叶凡 徐善泽

    Abstract: 本发明公开了一种基于图神经网络主题模型的文本分类方法,包括:1、对文本进行预处理;2、将文本中的各个词表示成两种词向量形式;3、对用单词袋表示的词向量,使用神经主题模型(NVDM‑GSM)得到文本的主题分布和主题向量;4、对用Glove模型表示的词向量,以文本中的单词为结点构建图结构,对图的每个结点使用门控图神经网络来获取结点的邻接信息;5、对结点间使用注意力机制;6、利用Softmax分类器对训练后的文档图进行分类。本发明不仅考虑文档中的单词对上下文依赖的特点,还引入注意力机制来权衡不同单词的重要性,并用文档的主题分布和主题向量从全局的角度来指导注意力机制,从而更好的对文本进行分类。

Patent Agency Ranking