-
公开(公告)号:CN116049387A
公开(公告)日:2023-05-02
申请号:CN202111257904.9
申请日:2021-10-27
Applicant: 广州市刑事科学技术研究所 , 厦门市美亚柏科信息股份有限公司
IPC: G06F16/35 , G06F40/289 , G06F40/216 , G06F40/211 , G06F18/241 , G06N3/042 , G06N3/0464 , G06N3/047 , G06N3/048 , G06N3/08
Abstract: 本发明提出了一种基于图卷积的短文本分类方法、装置、设备及存储介质,该方法包括:对获取的训练样本中的多个短文本进行预处理后得到分词结果、句法分析结果和词性分析结果,基于上述结果构建多特征融合图的矩阵;使用图卷积神经网络基于所述多特征融合图的矩阵对多特征融合图的节点进行训练,得到训练后的单词节点特征向量;构建位置嵌入向量,后与单词节点特征向量进行拼接后对分类器模型进行训练得到训练后的分类器模型;对待分类的短文本进行分词处理后基于所述训练后的单词节点特征向量得到待分类的短文本的词向量,进行分类。本发明提出了融合词性、依存性、文档信息的文本多特征图表示方法,提升分类的准确率,克服了背景技术中的缺陷。