-
公开(公告)号:CN119149749B
公开(公告)日:2025-04-04
申请号:CN202411659664.9
申请日:2024-11-20
Applicant: 南昌工程学院
IPC: G06F16/353 , G06F18/243 , G06F18/25 , G06F40/216 , G06F40/284 , G06N3/0455 , G06N3/0464 , G06N3/048
Abstract: 本公开涉及基于词频概率融合的文本大数据分级分类方法及其系统,包括:获取原始文本数据,对原始文本数据进行数据清洗和数据增强操作得到输入数据;根据所述输入数据构建基于概率分布的主题模型,通过基于概率分布的主题模型得到输入数据的主题‑词汇关系,将主题‑词汇关系与词嵌入模型进行特征融合,得到新的词嵌入模型;根据新的词嵌入模型,利用改进Transformer网络模型和卷积神经网络构建深度学习网络模型;对深度学习网络模型进行训练与参数优化,得到训练好的深度学习网络模型;将待分类数据输入训练好的深度学习网络模型中,得到分级分类结果。本公开方法可实现数据精准稳定的分类。
-
公开(公告)号:CN119149749A
公开(公告)日:2024-12-17
申请号:CN202411659664.9
申请日:2024-11-20
Applicant: 南昌工程学院
IPC: G06F16/35 , G06F18/243 , G06F18/25 , G06F40/216 , G06F40/284 , G06N3/0455 , G06N3/0464 , G06N3/048
Abstract: 本公开涉及基于词频概率融合的文本大数据分级分类方法及其系统,包括:获取原始文本数据,对原始文本数据进行数据清洗和数据增强操作得到输入数据;根据所述输入数据构建基于概率分布的主题模型,通过基于概率分布的主题模型得到输入数据的主题‑词汇关系,将主题‑词汇关系与词嵌入模型进行特征融合,得到新的词嵌入模型;根据新的词嵌入模型,利用改进Transformer网络模型和卷积神经网络构建深度学习网络模型;对深度学习网络模型进行训练与参数优化,得到训练好的深度学习网络模型;将待分类数据输入训练好的深度学习网络模型中,得到分级分类结果。本公开方法可实现数据精准稳定的分类。
-