-
公开(公告)号:CN114186062B
公开(公告)日:2025-05-02
申请号:CN202111521453.5
申请日:2021-12-13
Applicant: 安徽大学
IPC: G06F16/35 , G06F40/284 , G06F18/2411 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于图神经网络主题模型的文本分类方法,包括:1、对文本进行预处理;2、将文本中的各个词表示成两种词向量形式;3、对用单词袋表示的词向量,使用神经主题模型(NVDM‑GSM)得到文本的主题分布和主题向量;4、对用Glove模型表示的词向量,以文本中的单词为结点构建图结构,对图的每个结点使用门控图神经网络来获取结点的邻接信息;5、对结点间使用注意力机制;6、利用Softmax分类器对训练后的文档图进行分类。本发明不仅考虑文档中的单词对上下文依赖的特点,还引入注意力机制来权衡不同单词的重要性,并用文档的主题分布和主题向量从全局的角度来指导注意力机制,从而更好的对文本进行分类。
-
公开(公告)号:CN114186062A
公开(公告)日:2022-03-15
申请号:CN202111521453.5
申请日:2021-12-13
Applicant: 安徽大学
IPC: G06F16/35 , G06F40/284 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于图神经网络主题模型的文本分类方法,包括:1、对文本进行预处理;2、将文本中的各个词表示成两种词向量形式;3、对用单词袋表示的词向量,使用神经主题模型(NVDM‑GSM)得到文本的主题分布和主题向量;4、对用Glove模型表示的词向量,以文本中的单词为结点构建图结构,对图的每个结点使用门控图神经网络来获取结点的邻接信息;5、对结点间使用注意力机制;6、利用Softmax分类器对训练后的文档图进行分类。本发明不仅考虑文档中的单词对上下文依赖的特点,还引入注意力机制来权衡不同单词的重要性,并用文档的主题分布和主题向量从全局的角度来指导注意力机制,从而更好的对文本进行分类。
-