-
公开(公告)号:CN112328782B
公开(公告)日:2022-08-09
申请号:CN202011219386.7
申请日:2020-11-04
Applicant: 福州大学
Abstract: 本发明涉及一种融合图像过滤器的多模态摘要生成方法,包括步骤:获取输入文本的隐藏表示,得到文本上下文向量;提取输入图像的全局图像特征向量,并进行加权和计算得到图像上下文向量;对文本上下文向量与图像上下文向量进行融合,得到多模态信息的融合向量;采用图像过滤器来过滤图像中的噪声,选择最显著的图像特征,对图像上下文向量进行权重更新,并得到更新后的融合向量;采用单向的长短期记忆网络作为解码器,将更新后的融合向量解码得到最终的文本摘要。本发明从图像信息和文本信息融合出发,充分利用不同模态的信息提高文本摘要质量,并且能够应用于更大规模数据集应用场景。
-
公开(公告)号:CN109710946A
公开(公告)日:2019-05-03
申请号:CN201910034772.X
申请日:2019-01-15
Applicant: 福州大学
Abstract: 本发明涉及一种基于依赖解析树的联合论辩挖掘系统,包括:数据预处理模块,用于对数据进行预处理;文本嵌入模块,用于对从输入的文本中提取词、字符、词性、论点之间依赖关系以及论点类型的向量表示;序列编码模块,使用双向长短时记忆神经网络学习文本的上下文信息,用来完成论点边界检测和论点关系抽取的任务;依赖解析树模块,通过构建依赖解析树,用于在两个论点部件实体中寻找最短路经;论辩挖掘标签输出模块,用于完成论辩挖掘三个任务的标签预测工作,论点的类型标签和论点的关系标签。本发明能够从论辩文本数据中学习高质量的文本向量特点,最终检测出文本的论辩结构。
-
-
公开(公告)号:CN110825952A
公开(公告)日:2020-02-21
申请号:CN201911085552.6
申请日:2019-11-08
Applicant: 福州大学
IPC: G06F16/953 , G06F16/33 , G06N3/04
Abstract: 本发明涉及一种基于嵌套LSTM的水军评论检测方法,包括以下步骤:步骤S1:将输入的数据分为文本信息与行为信息;步骤S2:对行为信息进行特征抽取获得行为特征,并将文本信息送入所述文本特征提取模块,得到包含上下文信息的文本特征;步骤S3:将得到的包含上下文信息的文本特征送入所述嵌套LSTM模块,并提取该文本特征的空间结构信息,得到包含整体与部分关系的文本特征;步骤S4:将包含整体与部分关系的文本特征与行为特征输入至集成学习模块中,得到评论最终的分类结果。本发明能够抽取出有效特征,并对特征进行抽象和组合,最终识别出文本空间特征。
-
公开(公告)号:CN109783629A
公开(公告)日:2019-05-21
申请号:CN201910042008.7
申请日:2019-01-16
Applicant: 福州大学
IPC: G06F16/332 , G06F16/35 , G06N3/04
Abstract: 本发明涉及一种融合全局事件关系信息的微博客事件谣言检测方法,提供一文本数据预处理模块,用以获得微博客事件的微博文本的段落向量;提供一事件特征自动抽取模块,用以抽取出微博客事件的特征向量;提供一全局事件关系特征抽取模块,用以得到事件全局关系信息的事件向量表示;提供一分类结果输出模块,用以拼接出最终的事件向量并通过分类函数得到微博客事件最终的谣言检测结果;能够较好地进行微博客事件类别的分析且通用性强,能站在在数据使用者的角度进行谣言检测。
-
公开(公告)号:CN114969292B
公开(公告)日:2024-08-09
申请号:CN202210610767.0
申请日:2022-05-31
Applicant: 福州大学
IPC: G06F16/332 , G06N3/0464 , G06N3/08
Abstract: 本发明涉及一种基于多回复解码器的对话系统。数据预处理模块对系统回复和用户对话进行去词化操作;对话编码器模块负责编码历史对话信息,将对话文本序列映射为对应时间步的隐藏状态表征向量;对话状态解码器模块负责根据对话编码器的输出和上一轮对话状态,解码出本轮对话状态;外部数据库模块,负责根据对话状态解码器的输出查询满足用户要求的所有实体,以三元组(领域,槽,槽值)的形式存储;系统动作解码器模块,负责根据对话状态解码器的输出、数据库的返回结果和本轮用户对话解码出本轮系统动作;系统回复生成模块,由全局回复解码器、专业子解码器及通道选择网络组成。本发明能够提高系统回复的准确性,提高用户和系统的交互效率。
-
公开(公告)号:CN109783586B
公开(公告)日:2022-10-21
申请号:CN201910051767.X
申请日:2019-01-21
Applicant: 福州大学
Abstract: 本发明涉及一种基于聚类重采样的水军评论检测系统,包括:一聚类参数计算模块,用于计算出合适的评论簇个数以及簇中心点参数;一聚类计算模块,用于聚类生成评论簇并重采样;一集成学习模块,用于文本特征提取与集成学习。本发明能够较好地进行评论类别的分析且通用性强,适应非平衡分布的水军评论数据集。
-
公开(公告)号:CN112199606A
公开(公告)日:2021-01-08
申请号:CN202011186366.4
申请日:2020-10-30
Applicant: 福州大学
IPC: G06F16/9536 , G06F40/289 , G06N3/04
Abstract: 本发明涉及一种基于层次用户表示的面向社交媒体的谣言检测系统,包括数据预处理模块,用于对数据进行预处理,抽取用户静态行为特征,按照时间序列对数据进行分段处理;文本表示学习模块,用于从微博/推特文本内容层面以及时间段层面学习词语序列和时间段序列所蕴含的隐层表达,作为事件的文本表示向量,用户行为特征表示学习模块,用于捕获用户行为特征潜在的变化规律及其隐层信息,作为事件的用户行为特征表示向量;谣言检测标签输出模块,用于融合文本、用户行为特征隐藏向量表示,完成谣言检测的标签预测工作。本发明能够较好地对社交媒体上的谣言事件进行检测,并且在早期谣言检测中具备更加快速和稳定的检测效果。
-
公开(公告)号:CN110889292A
公开(公告)日:2020-03-17
申请号:CN201911205403.9
申请日:2019-11-29
Applicant: 福州大学
IPC: G06F40/30 , G06F40/284 , G06F16/34
Abstract: 本发明涉及一种基于句义结构模型的文本数据生成观点摘要的方法及系统,首先提取网站上的待处理数据集,并对其进行预处理;然后构建话题语料集和背景语料集,并提取话题属性;接着进行语义权值计算,得到句子的语义权重值;再进行关联权重计算,得到句子的关联权重值;最后利用话题属性、语义权重值以及关联权重值在话题中抽取观点摘要。本发明从话题属性及其情感信息出发解决当前研究方法存在的问题,能够高效准确地得到话题文本的观点摘要,能够应用于更大规模数据集应用场景。
-
公开(公告)号:CN110879834A
公开(公告)日:2020-03-13
申请号:CN201911180005.6
申请日:2019-11-27
Applicant: 福州大学
IPC: G06F16/33 , G06F40/205 , G06F40/242 , G06F40/279 , G06F40/30 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明涉及一种基于循环卷积网络的观点检索系统及其观点检索方法,数据预处理模块对文本数据进行预处理;查询语句与文档相关性得分计算模块将查询-文档分别映射到低维的语义空间中获取词向量表示,输入循环神经网络学习文本上下文语义信息,计算出相关性得分;待查询文档的观点得分计算模块计算文档的观点得分;统一相关检索模块根据相关性得分以及文档观点得分进行计算,由高到低排序得到查询的观点检索结果;排序学习检索模块将相关性得分作为新的特征加入到常用的特征、文本概念化特征、网络表示特征和观点得分特征中,将这些特征融入到排序学习框架中进行分类,按照顺序输出文档。本发明能够更好的提高语义泛化程度观点检索模型的准确性。
-
-
-
-
-
-
-
-
-