-
公开(公告)号:CN114117040A
公开(公告)日:2022-03-01
申请号:CN202111315298.1
申请日:2021-11-08
Applicant: 重庆邮电大学
Abstract: 本发明请求保护一种基于标签特定特征和标签相关性的文本数据多标签分类方法,包括:101对文本数据进行预处理,结合实例标签空间和特征空间构造新的实例特征空间;102对正负实例特征空间计算聚类个数,并构造标签特定特征;103对文本数据集中成对标签计算相关性,构造标签间相关性无向完全图;104采用扩展Kruskal算法在图中计算最大生成树集合;105从树集合中依次选择生成树,并从根节点开始使用二分类器在树上进行递归预测,对预测结果进行树上集成得出文本实例标签集。本发明能够有效的抑制预测过程中的误差传递问题,并且采用树集合集成预测,能够有效的利用标签集合间不同的相关性,进一步提高多标签分类的性能。
-
公开(公告)号:CN114398479A
公开(公告)日:2022-04-26
申请号:CN202111343626.9
申请日:2021-11-13
Applicant: 重庆邮电大学
IPC: G06F16/35 , G06F40/205 , G06F40/216 , G06F40/289 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于时序交互图神经网络的文本分类方法,该方法包括:获取文本数据以及文本数据对应的标签值,并将文本数据构建为自适应图结构数据;基于自适应距离权重算法对图节点集合和图有向边集合进行处理,得到输入特征矩阵;将所述输入特征矩阵和所述标签值输入到时序交互图神经网络模型中,得到所述文本数据的总损失值;基于总损失值、交叉熵损失函数和梯度下降算法对时序交互图神经网络模型的模型参数进行更新优化,得到训练文本分类模型。本发明还公开了一种文本分类装置和一种介质。本发明能够实现增强图神经网络的特征提取能力,改善图读出器函数对文本数据的表达以及分类,降低图神经网络出现过度平滑问题出现的概率。
-