-
公开(公告)号:CN109783586B
公开(公告)日:2022-10-21
申请号:CN201910051767.X
申请日:2019-01-21
Applicant: 福州大学
Abstract: 本发明涉及一种基于聚类重采样的水军评论检测系统,包括:一聚类参数计算模块,用于计算出合适的评论簇个数以及簇中心点参数;一聚类计算模块,用于聚类生成评论簇并重采样;一集成学习模块,用于文本特征提取与集成学习。本发明能够较好地进行评论类别的分析且通用性强,适应非平衡分布的水军评论数据集。
-
公开(公告)号:CN108268668B
公开(公告)日:2022-01-18
申请号:CN201810166896.9
申请日:2018-02-28
Applicant: 福州大学
IPC: G06F16/953 , G06F16/36 , G06F16/33
Abstract: 本发明提供一种基于话题多样性的文本数据观点摘要挖掘方法,其包括以下步骤:步骤S1:对话题文本进行预处理;步骤S2:输入话题语料集和背景语料集;步骤S3:提取话题语料集的话题属性;步骤S4:将得到的话题属性添加情感极性,用于对句子向量化;步骤S5:将得到的话题属性作为评价对象,采用面向多评价对象的动态词序列情感分析方法分析句子中包含的评价对象的情感极性,得出句子包含的情感属性特征,将一个句子进行特征向量化;步骤S6:利用步骤S5得到的文本句子特征向量构建多样性目标函数。能够高效准确地得到话题文本的观点摘要,并且能够应用于更大规模数据集应用场景。
-
公开(公告)号:CN113642332A
公开(公告)日:2021-11-12
申请号:CN202110919005.4
申请日:2021-08-11
Applicant: 福州大学
Abstract: 本发明提出一种融合多级语义信息的多模态讽刺识别系统方法,所述方法通过融合多级语义信息来分析多模态数据,然后以讽刺识别模块来判别多模态数据中是否存在讽刺感;在生成多模态数据时,以特征提取模块提取图文数据的特征表示及图文数据的中级语义信息,以图文融合模块融合图文数据的特征表示并提取产生讽刺感的图文片段,以语义融合模块融合图文数据的中级、高级语义信息;本发明能够提取图文模态数据的特征表示及图文数据中的中级语义信息,通过注意力机制融合多模态数据,并关联图文模态的中级语义,分析多模态数据中是否存在讽刺感。
-
公开(公告)号:CN113505208A
公开(公告)日:2021-10-15
申请号:CN202110776034.X
申请日:2021-07-09
Applicant: 福州大学
IPC: G06F16/332 , G06N3/04 , G06N3/08
Abstract: 本发明涉及一种融合多路注意力机制的智能对话系统,包括依次连接的编码器模块、多路注意力模块、动态融合模块、外部知识模块和解码器模块;所述编码器模块,用于针对历史上下文进行多领域的编码;所述多路注意力模块,用于提取上下文单词之间的注意力关系;所述动态融合模块,用于融合编码器和注意力的编码结果;所述外部知识模块,用于辅助生成特定领域知识的句子内容;所述解码器模块,用于生成具体的句子内容。本发明能够通过对话的历史上下文信息,抽取不同领域细粒度和句子细粒度的编码信息,并利用记忆网络从外部知识库中抽取有用的外部知识信息,最终将二者信息融合生成具体的句子,提高对话智能化。
-
公开(公告)号:CN112199606A
公开(公告)日:2021-01-08
申请号:CN202011186366.4
申请日:2020-10-30
Applicant: 福州大学
IPC: G06F16/9536 , G06F40/289 , G06N3/04
Abstract: 本发明涉及一种基于层次用户表示的面向社交媒体的谣言检测系统,包括数据预处理模块,用于对数据进行预处理,抽取用户静态行为特征,按照时间序列对数据进行分段处理;文本表示学习模块,用于从微博/推特文本内容层面以及时间段层面学习词语序列和时间段序列所蕴含的隐层表达,作为事件的文本表示向量,用户行为特征表示学习模块,用于捕获用户行为特征潜在的变化规律及其隐层信息,作为事件的用户行为特征表示向量;谣言检测标签输出模块,用于融合文本、用户行为特征隐藏向量表示,完成谣言检测的标签预测工作。本发明能够较好地对社交媒体上的谣言事件进行检测,并且在早期谣言检测中具备更加快速和稳定的检测效果。
-
公开(公告)号:CN111274396A
公开(公告)日:2020-06-12
申请号:CN202010062565.8
申请日:2020-01-20
Applicant: 福州大学
IPC: G06F16/35 , G06F40/284 , G06F40/30 , G06F40/247 , G06N3/04 , G06N3/08
Abstract: 本发明涉及一种基于外部知识的视角级文本情感分类方法及系统,包括步骤:对视角级文本进行特征化处理,并捕获文本的双向语义依赖关系;通过动态注意力机制将当前单词与外部知识同义词相结合,并引入哨兵向量避免外部知识对模型的误导;通过位置注意力机制来判断每个单词对视角词的贡献程度;通过计算每个记忆内容的注意力得分,利用门限循环单元将每层的注意力得分与上一层的输出结果非线性结合,并将最后一层作为文本的情感特征表示;利用分类函数得到最终的情感分类结果。本发明能够提高视角级文本情感分类的性能和降低资源的消耗。
-
公开(公告)号:CN110889292A
公开(公告)日:2020-03-17
申请号:CN201911205403.9
申请日:2019-11-29
Applicant: 福州大学
IPC: G06F40/30 , G06F40/284 , G06F16/34
Abstract: 本发明涉及一种基于句义结构模型的文本数据生成观点摘要的方法及系统,首先提取网站上的待处理数据集,并对其进行预处理;然后构建话题语料集和背景语料集,并提取话题属性;接着进行语义权值计算,得到句子的语义权重值;再进行关联权重计算,得到句子的关联权重值;最后利用话题属性、语义权重值以及关联权重值在话题中抽取观点摘要。本发明从话题属性及其情感信息出发解决当前研究方法存在的问题,能够高效准确地得到话题文本的观点摘要,能够应用于更大规模数据集应用场景。
-
公开(公告)号:CN110879834A
公开(公告)日:2020-03-13
申请号:CN201911180005.6
申请日:2019-11-27
Applicant: 福州大学
IPC: G06F16/33 , G06F40/205 , G06F40/242 , G06F40/279 , G06F40/30 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明涉及一种基于循环卷积网络的观点检索系统及其观点检索方法,数据预处理模块对文本数据进行预处理;查询语句与文档相关性得分计算模块将查询-文档分别映射到低维的语义空间中获取词向量表示,输入循环神经网络学习文本上下文语义信息,计算出相关性得分;待查询文档的观点得分计算模块计算文档的观点得分;统一相关检索模块根据相关性得分以及文档观点得分进行计算,由高到低排序得到查询的观点检索结果;排序学习检索模块将相关性得分作为新的特征加入到常用的特征、文本概念化特征、网络表示特征和观点得分特征中,将这些特征融入到排序学习框架中进行分类,按照顺序输出文档。本发明能够更好的提高语义泛化程度观点检索模型的准确性。
-
公开(公告)号:CN110874411A
公开(公告)日:2020-03-10
申请号:CN201911138355.6
申请日:2019-11-20
Applicant: 福州大学
IPC: G06F16/35 , G06F40/205 , G06F40/289 , G06F40/30 , G06K9/62 , G06N3/04
Abstract: 本发明涉及一种基于注意力机制融合的跨领域情感分类系统。包括:评论文本预处理模块,用于获取源领域和目标领域文本的向量形式;文本语义学习模块,用于学习词语之间的语义依赖关系;注意力机制融合模块,通过将不同的注意力方式进行融合,获得词语对文本分类的综合权重;分层注意模块,分别从词级和句子级计算文本的注意力权重,判断词语对句子表示,句子对文档表示的权重;情感类别输出模块,利用分类函数得到最终的情感分类结果。本发明能够自动抽取出目标领域与源领域的潜在通用特征,并对特征进行抽象和组合,最终识别出目标领域文本的情感类别。
-
公开(公告)号:CN110874397A
公开(公告)日:2020-03-10
申请号:CN201911138610.7
申请日:2019-11-20
Applicant: 福州大学
Abstract: 本发明涉及一种基于注意力机制的水军评论检测系统及方法。包括文本特征处理模块,用于将文本特征进行向量化处理并提取文本的离散特征进行归一化处理;行为特征提取模块,用于将行为特征进行向量化处理并进行归一化处理;注意力机制权重计算模块,用于计算归一化后的文本特征、行为特征的注意力权重;集成学习模块,将带有权重的行为特征、文本特征作为输入,用分类函数得到评论最终的分类结果。本发明提出的系统及方法能够自动抽取出有效特征,并对特征进行抽象和组合,最终识别出分类结果。
-
-
-
-
-
-
-
-
-