-
公开(公告)号:CN114328843B
公开(公告)日:2025-01-14
申请号:CN202210025558.X
申请日:2022-01-11
Applicant: 南京邮电大学
IPC: G06F16/334 , G06F16/35 , G06F40/247 , G06F40/284 , G06F40/30 , G06F18/214
Abstract: 本发明公开了一种基于多层编码网络的谣言检测方法及系统,属于自然语言处理领域,包括:获取所有待检测的文本,对文本进行预处理;将带有标记词汇表的词片嵌入预处理后的文本,将文本中单词转换为token标记词,然后进行向量编码得到各文本对应的词向量;对所有词向量进行处理得到输入向量;将输入向量输入预训练好的多层编码网络中,生成输出向量;将输出向量进行处理得到隐藏状态向量;将隐藏状态向量送入隐藏层和分类器,得到待检测文本被检测为各谣言类别的概率,概率最大的类别为该文本的检测结果;有效缓解了训练速度慢、效果差等问题,实现对词语和句子级别信息的学习,有利于提取不同文本之间的关系表示,提高了谣言检测的准确性。
-
公开(公告)号:CN114328843A
公开(公告)日:2022-04-12
申请号:CN202210025558.X
申请日:2022-01-11
Applicant: 南京邮电大学
IPC: G06F16/33 , G06F16/35 , G06F40/247 , G06F40/284 , G06F40/30 , G06K9/62
Abstract: 本发明公开了一种基于多层编码网络的谣言检测方法及系统,属于自然语言处理领域,包括:获取所有待检测的文本,对文本进行预处理;将带有标记词汇表的词片嵌入预处理后的文本,将文本中单词转换为token标记词,然后进行向量编码得到各文本对应的词向量;对所有词向量进行处理得到输入向量;将输入向量输入预训练好的多层编码网络中,生成输出向量;将输出向量进行处理得到隐藏状态向量;将隐藏状态向量送入隐藏层和分类器,得到待检测文本被检测为各谣言类别的概率,概率最大的类别为该文本的检测结果;有效缓解了训练速度慢、效果差等问题,实现对词语和句子级别信息的学习,有利于提取不同文本之间的关系表示,提高了谣言检测的准确性。
-