-
公开(公告)号:CN109783644A
公开(公告)日:2019-05-21
申请号:CN201910048910.X
申请日:2019-01-18
Applicant: 福州大学
Abstract: 本发明涉及一种基于文本表示学习的跨领域情感分类系统及方法,包含一个评论文本预处理模块,用于对跨领域文本进行特征化处理;包含一个文本表示学习模块,用于学习领域适应的特征表示空间,挖掘出源领域与目标领域潜在的通用领域特征和情感特征;包含一个文本表示强化模块,生成对抗模型用于自动生成鲁棒的源领域文本表示并判别其情感类别,根据误差不断更新模型参数;包含一个情感类别输出模块,利用分类函数得到最终的情感分类结果。本发明能够自动抽取出目标领域与源领域的潜在通用特征,并对特征进行抽象和组合,最终识别出目标领域文本的情感类别。
-
公开(公告)号:CN109711485A
公开(公告)日:2019-05-03
申请号:CN201910041884.8
申请日:2019-01-16
Applicant: 福州大学
IPC: G06K9/62
Abstract: 本发明涉及一种基于社区检测的多标签分类方法,包括一个数据预处理模块,用于得到网络节点表示;一个社区发现模块,利用一个基于高斯混合模型的目标函数同时来进行社区发现和嵌入;一个节点嵌入模块,利用一个非线性映射函数连接的深层模型,来表示节点向量,模型的输入层包括来自目标节点及其邻域的属性信息,输出层表示节点的向量特征;一个融合模块,定义了一个社区发现和嵌入的目标函数,并联合节点嵌入的信息进行反馈,得到最终的节点向量表示;一个分类结果输出模块,用分类函数得到节点最终的多标签分类结果。本发明,能够结合社区发现和社区嵌入的方法,能够较好的从数据集中将节点进行标签分类。
-
公开(公告)号:CN109710769A
公开(公告)日:2019-05-03
申请号:CN201910061913.7
申请日:2019-01-23
Applicant: 福州大学
Abstract: 本发明涉及一种基于胶囊网络的水军评论检测系统及方法,包含一个文本特征提取模块,用于得到文本特征;包含胶囊网络模块,提取空间结构信息;包含一个集成学习模块,双层堆叠分类器,用分类函数得到评论最终的分类结果。本发明能够自动抽取出有效特征,并对特征进行抽象和组合,最终识别出文本空间特征。
-
公开(公告)号:CN108460019A
公开(公告)日:2018-08-28
申请号:CN201810170148.8
申请日:2018-02-28
Applicant: 福州大学
Abstract: 本发明涉及一种基于注意力机制的新兴热点话题检测系统,包括:数据预处理模块、分层序列模型、词序列编码层、词语级别注意力层、句子级别编码层、句子级别注意力层、话题预测模块。本发明提出的一种基于注意力机制的新兴热点话题检测系统,在双向循环神经网络基础上,加入两层注意力机制来加强话题的向量表示,提出基于注意力机制的分层循环神经网络模型,能够利用社交媒介中数据的各维度作为特征,训练高质量的话题向量特征,从而检测出新兴热点话题,并提高了新兴热点话题检测能力。
-
公开(公告)号:CN108399241A
公开(公告)日:2018-08-14
申请号:CN201810170864.6
申请日:2018-02-28
Applicant: 福州大学
Abstract: 本发明涉及一种基于多类特征融合的新兴热点话题检测系统,包括:数据预处理模块,用于对微博文本进行预处理;分层序列模型,用于训练双向循环神经网络模型,通过使用双向的LSTM网络,训练输入的微博文本;词序列编码层,用于对句子中的各个词语向量化,形成初步的向量表示;句子级别特征求解层,用于对微博句子构建静态特征向量,与该层的神经网络动态特征进行链接,形成微博句子向量表示;话题级别特征求解层,用于对话题构建静态特征向量,与该层的神经网络动态特征进行链接,形成话题的向量表示;话题预测模块,用于对话题进行预测。本发明基于双向长短时期记忆网络架构,加入相应的动态特征和静态特征,提高新兴热点话题检测能力。
-
公开(公告)号:CN104268230B
公开(公告)日:2017-09-15
申请号:CN201410504376.6
申请日:2014-09-28
Applicant: 福州大学
IPC: G06F17/30
Abstract: 本发明涉及一种基于异质图随机游走的中文微博客观点探测方法,包括:1、按话题采集微博,形成多个以话题为单位的微博集合;对微博进行预处理,去除噪声,形成词的集合的形式;2、从微博中识别出话题的关键词:计算每个词对于相应话题的权重,然后所有词根据权重的大小进行排序,将各话题中排序结果的前K个词作为相应话题的关键词;3、基于图模型探测微博中针对话题的主流观点:构建每条微博的特征向量,然后利用微博用户、微博和关键词之间的关系,以微博用户、微博、关键词为节点构建出微博图,再通过随机游走算法计算微博图中各节点的得分,最终得到针对各话题的微博的排序列表。该方法探测速度快、准确度高,通用性强,适用范围广。
-
公开(公告)号:CN104217026B
公开(公告)日:2017-08-11
申请号:CN201410504180.7
申请日:2014-09-28
Applicant: 福州大学
IPC: G06F17/30
Abstract: 本发明涉及一种基于图模型的中文微博客倾向性检索方法,包括以下步骤:(1) 对微博进行预处理,包括去噪声、分词、停用词处理,得到预处理后的微博;(2) 根据预先收集的并经过预处理的倾向性微博集,并基于图模型方法计算倾向词典中每个倾向词的倾向性权重,反映每一个倾向词不同的倾向性强度;(3) 根据微博和给定的查询主题,计算每条微博的相关性得分,然后对微博进行倾向性得分计算,得到每条微博的倾向性得分,最后将每条微博的相关性得分与倾向性得分的乘积作为每条微博最终的排名得分,并基于所述排名得分对微博进行排名,得到最终的微博列表。该方法检索速度快,准确度高,适用范围广,应用性强。
-
公开(公告)号:CN103745000B
公开(公告)日:2017-02-01
申请号:CN201410034402.3
申请日:2014-01-24
Applicant: 福州大学
IPC: G06F17/30
Abstract: 本发明涉及一种中文微博客的热点话题检测方法,包括以下步骤:(1)首先基于一定的垃圾过滤规则对垃圾微博进行过滤;(2)对分布在微博中的关键字进行初步聚合,得到初步表示话题的词集合;检索各条微博最相似的前k条微博,然后利用检索的结果和关键字初步聚合的结果来丰富各条微博特征,得到各条微博特征丰富后的特征向量;(3)基于各条微博特征丰富后的特征向量,利用增量聚类方法对所有微博进行聚类,得到聚类的话题集合,然后通过一定的话题热度计算公式对聚类的话题集合进行话题热度计算,最终得到热点话题列表。该方法能够高效、准确地对中文微博客进行热点话题检测,检测速度快,准确度高,适用范围广,应用性强。
-
公开(公告)号:CN104268648A
公开(公告)日:2015-01-07
申请号:CN201410504179.4
申请日:2014-09-28
Applicant: 福州大学
CPC classification number: G06F17/30864 , G06Q50/01
Abstract: 本发明涉及一种融合用户多种交互信息和用户主题信息的用户排名系统,包括:一个数据预处理模块,用于过滤没有任何交互信息的用户,并记录用户与用户之间的交互关系信息,建立用户交互关系矩阵;一个用户多种交互关系构建模块,用于融合用户与好友之间的关注或评论信息,以及用户好友的主题相关度信息,构建融合多关系的三阶张量模型;一个用户交互行为强度预测模块,用于预测用户在社交媒介上与外界用户之间的交互关系强度;一个用户综合影响力测算模块,用于估算查询关键词下的用户综合影响力得分,并根据用户综合影响力得分,对用户进行综合排序。该系统检测速度快,准确度高,适用范围广,应用性强。
-
公开(公告)号:CN104217026A
公开(公告)日:2014-12-17
申请号:CN201410504180.7
申请日:2014-09-28
Applicant: 福州大学
IPC: G06F17/30
CPC classification number: G06F17/30731
Abstract: 本发明涉及一种基于图模型的中文微博客倾向性检索方法,包括以下步骤:(1)对微博进行预处理,包括去噪声、分词、停用词处理,得到预处理后的微博;(2)根据预先收集的并经过预处理的倾向性微博集,并基于图模型方法计算倾向词典中每个倾向词的倾向性权重,反映每一个倾向词不同的倾向性强度;(3)根据微博和给定的查询主题,计算每条微博的相关性得分,然后对微博进行倾向性得分计算,得到每条微博的倾向性得分,最后将每条微博的相关性得分与倾向性得分的乘积作为每条微博最终的排名得分,并基于所述排名得分对微博进行排名,得到最终的微博列表。该方法检索速度快,准确度高,适用范围广,应用性强。
-
-
-
-
-
-
-
-
-