-
公开(公告)号:CN114757185B
公开(公告)日:2025-05-06
申请号:CN202210421678.1
申请日:2022-04-21
Applicant: 东南大学
IPC: G06F40/16 , G06F40/284 , G06F40/216 , G06F16/35 , G06N3/042 , G06N3/045 , G06F18/2415 , G06F18/26 , G06N3/08
Abstract: 本发明公开了一种基于动态图注意力胶囊网络的谣言检测方法与装置,能够对社交媒体中的帖子进行谣言识别,从而提供给用户检测谣言的预判机制。本发明首先使用动态网络框架DYN对谣言传播过程中积累的评论以时间顺序进行划分,形成多个静态的以图为基础的子评论结构;然后利用图注意力胶囊网络模块GACN对每个子评论结构进行编码形成子结构分类胶囊,从而挖掘谣言文本的属性特征;最后设计分类胶囊注意力机制整合各子分类胶囊捕获谣言评论结构随时间动态演化过程中的动态交互特征,进而获得谣言检测结果。本发明能够有效挖掘谣言文本深层次的属性以及评论结构随时间演化的动态交互特征,提升了谣言检测任务的准确率。
-
公开(公告)号:CN113111663B
公开(公告)日:2024-09-06
申请号:CN202110467022.9
申请日:2021-04-28
Applicant: 东南大学
IPC: G06F40/30 , G06F40/216 , G06F16/953 , G06N3/0464 , G06N3/049 , G06N3/084
Abstract: 本发明公开了一种融合关键信息的摘要生成方法,能够为媒体文本自动地生成摘要。本发明首先通过互联网采集媒体文本,并在媒体文本基础上按人工规则生成标准摘要构造出样本数据集;然后对数据集进行预处理,生成训练模型的输入数据;接着构建基于关键信息融合的seq2seq摘要生成模型,并联合三元组损失与交叉熵损失进行模型训练;最后基于训练完毕后的模型进行输出模型的构建,并利用输出模型对待进行摘要的媒体文本进行自动摘要生成。与现有技术相比,本发明联合关键词与主题信息作为关键信息,能够多层次地对摘要生成过程进行引导,从而提高摘要结果的信息覆盖度与主题一致性。
-
公开(公告)号:CN113111136B
公开(公告)日:2024-04-16
申请号:CN202110475291.X
申请日:2021-04-29
Applicant: 东南大学
IPC: G06F16/28 , G06N3/049 , G06N3/08 , G06N3/0464
Abstract: 本发明提供了一种基于UCL知识空间的实体消歧方法及装置,首先构建基础知识库,完成UCL知识空间的构建;随后从UCL知识空间中获取待消歧实体相关的候选实体集合,利用词向量表示方法生成候选实体和待消歧实体的嵌入表示;接着抽取待消歧实体及其上下文的概念特征,抽取候选实体上下文的特征;最后利用之前生成的四个向量表示作为输入,采用基于深度结构化语义匹配模型DSSM的自注意力匹配网络,获得匹配度;根据匹配结果的排序得到最终消歧结果,完成文本中实体与UCL知识空间中实体的实体链接。本发明既能够解决短文本中实体相关信息较少的问题,还能提高实体消歧的准确度。
-
公开(公告)号:CN114692605B
公开(公告)日:2025-05-06
申请号:CN202210415569.9
申请日:2022-04-20
Applicant: 东南大学
IPC: G06F40/284 , G06F40/211 , G06F40/30 , G06F18/23 , G06F18/25 , G06N3/0455 , G06N3/0442 , G06N3/084
Abstract: 本发明公开了一种融合句法结构信息的关键词生成方法及装置,能够为新闻文章自动地生成关键词。本发明首先使用爬虫工具采集新闻文章,并采取人工标注参考关键词构造出新闻文章数据集;然后对文本进行预处理,依存句法分析和过滤停用词;接着基于循环神经网络的顺序编码器和基于图卷积网络的图编码器分别获取文章的上下文语义和结构特征,并利用聚类方法将文本分为包含不同子主题部分,并利用多个基于注意力机制的解码器并行生成关键词;采样交叉熵损失进行模型参数优化;最后基于训练后的模型对待处理的新闻文章进行自动关键词生成。本发明通过句法结构信息弥补顺序编码存在的长距离单词依赖信息损失问题,从而提高生成关键词的质量。
-
公开(公告)号:CN113094587B
公开(公告)日:2024-04-16
申请号:CN202110443867.4
申请日:2021-04-23
Applicant: 东南大学
IPC: G06F16/9535 , G06F16/9536 , G06F16/36 , G06Q50/00
Abstract: 本发明提供了一种基于知识图谱路径的隐式推荐方法,包括如下步骤:在知识图谱中提取用户和候选item之间的路径;将路径输入注意力知识路径模块AKPM中,捕获知识图谱中用户和候选item之间的显式特征;将用户的历史交互记录和候选item输入IFEM中,捕获知识图谱之外的隐式特征;融合显式和隐式特征向量得到推荐分数。本发明充分利用用户的行为记录,在捕获用户和候选item之间的显式特征的同时,还能够捕获知识图谱之外item之间的知识图谱之外的隐式特征,将显式和隐式特征融合并用于推荐,相比其他方法,本发明方法推荐准确率高,可解释性好。
-
公开(公告)号:CN114925211A
公开(公告)日:2022-08-19
申请号:CN202210385244.0
申请日:2022-04-13
Applicant: 东南大学
IPC: G06F16/36 , G06F16/35 , G06N3/04 , G06F16/901
Abstract: 本发明公开了一种面向表格型数据的事实验证方法,能够用于检验网络上声明的真实性,包括如下步骤:首先针对输入的表格数据和文本声明,利用DeBERTa模型获得单一模态的编码表示;然后将单一模态的编码表示作为交叉模态Transformer模块的输入,分别获得融合模态间信息的表格表示和文本声明表示;最后通过构建一个图神经网络,提取表格的结构信息以及文本的语义信息来进行信息传递和推理;最后利用一个多层感知器获得声明真实性的预测结果,本发明结合图神经网络来对表格数据进行表示,并联合多模态技术增强文本声明和表格数据之间的交互,增强了模型的表示学习能力和推理能力,从而提高了声明真实性预测的准确性。
-
公开(公告)号:CN113326695A
公开(公告)日:2021-08-31
申请号:CN202110455888.8
申请日:2021-04-26
Applicant: 东南大学
IPC: G06F40/247 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于迁移学习的情感极性分析方法,本发明首先构建文本排序模型,弥补当前语言模型缺乏句子级预训练任务的缺陷,提高模型的逻辑感知与语义表达能力。然后,构建情感极性分析模型,将文本排序模型训练得到的相关参数迁移到情感极性分析模型中对应的位置。最后,将迁移后的模型在情感极性分析数据集上继续训练。本发明利用迁移学习为情感极性分析模型引入领域先验知识,可以提高模型的领域适应性,有助于获取更高质量的句子特征,进而提高模型的分类准确率,并且,本发明所采用的注意力机制可以为情感极性分析模型降低评论文本的噪声干扰,提高模型的分类鲁棒性。
-
公开(公告)号:CN113094596B
公开(公告)日:2025-01-28
申请号:CN202110454550.0
申请日:2021-04-26
Applicant: 东南大学
IPC: G06F16/9536 , G06F18/214 , G06F18/2415 , G06N3/0464 , G06N3/084
Abstract: 本发明公开了一种基于双向传播图的多任务谣言检测方法,该方法可用于社交网络帖子的谣言检测以及评论信息的立场检测。本发明首先根据谣言帖子的内容生成文本特征矩阵、用户特征矩阵和文本统计特征矩阵,之后构建谣言的双向传播图,通过计算双向图卷积并进行根节点特征增强抽取谣言的传播特征,最后对传播特征进行平均池化和特征整合后,训练softmax分类器,获取谣言检测和立场检测结果。本发明能够有效地获取谣言的顺序传播特征和广度散布特征,并且引入用户评论的立场检测作为辅助任务,从而提高模型的泛化性,进一步提高谣言检测任务的准确率。
-
公开(公告)号:CN114925211B
公开(公告)日:2024-08-06
申请号:CN202210385244.0
申请日:2022-04-13
Applicant: 东南大学
IPC: G06F16/36 , G06F16/35 , G06N3/045 , G06F16/901 , G06N3/0499 , G06N3/0442 , G06N3/0464
Abstract: 本发明公开了一种面向表格型数据的事实验证方法,能够用于检验网络上声明的真实性,包括如下步骤:首先针对输入的表格数据和文本声明,利用DeBERTa模型获得单一模态的编码表示;然后将单一模态的编码表示作为交叉模态Transformer模块的输入,分别获得融合模态间信息的表格表示和文本声明表示;最后通过构建一个图神经网络,提取表格的结构信息以及文本的语义信息来进行信息传递和推理;最后利用一个多层感知器获得声明真实性的预测结果,本发明结合图神经网络来对表格数据进行表示,并联合多模态技术增强文本声明和表格数据之间的交互,增强了模型的表示学习能力和推理能力,从而提高了声明真实性预测的准确性。
-
公开(公告)号:CN113326695B
公开(公告)日:2024-04-26
申请号:CN202110455888.8
申请日:2021-04-26
Applicant: 东南大学
IPC: G06F40/247 , G06F40/30 , G06N3/0464 , G06N3/047 , G06N3/096
Abstract: 本发明公开了一种基于迁移学习的情感极性分析方法,本发明首先构建文本排序模型,弥补当前语言模型缺乏句子级预训练任务的缺陷,提高模型的逻辑感知与语义表达能力。然后,构建情感极性分析模型,将文本排序模型训练得到的相关参数迁移到情感极性分析模型中对应的位置。最后,将迁移后的模型在情感极性分析数据集上继续训练。本发明利用迁移学习为情感极性分析模型引入领域先验知识,可以提高模型的领域适应性,有助于获取更高质量的句子特征,进而提高模型的分类准确率,并且,本发明所采用的注意力机制可以为情感极性分析模型降低评论文本的噪声干扰,提高模型的分类鲁棒性。
-
-
-
-
-
-
-
-
-