一种基于句义结构模型的文本数据生成观点摘要的方法及系统

    公开(公告)号:CN110889292B

    公开(公告)日:2022-06-03

    申请号:CN201911205403.9

    申请日:2019-11-29

    Applicant: 福州大学

    Abstract: 本发明涉及一种基于句义结构模型的文本数据生成观点摘要的方法及系统,首先提取网站上的待处理数据集,并对其进行预处理;然后构建话题语料集和背景语料集,并提取话题属性;接着进行语义权值计算,得到句子的语义权重值;再进行关联权重计算,得到句子的关联权重值;最后利用话题属性、语义权重值以及关联权重值在话题中抽取观点摘要。本发明从话题属性及其情感信息出发解决当前研究方法存在的问题,能够高效准确地得到话题文本的观点摘要,能够应用于更大规模数据集应用场景。

    基于图卷积神经网络的视角级文本情感分类方法及系统

    公开(公告)号:CN113641820A

    公开(公告)日:2021-11-12

    申请号:CN202110913656.2

    申请日:2021-08-10

    Applicant: 福州大学

    Abstract: 本发明涉及一种基于图卷积神经网络的视角级文本情感分类系统及方法,包括:文本预处理模块,用于对视角级文本进行特征化处理;文本语义信息获取模块,用于捕获文本的双向语义依赖关系;注意力编码模块,用于捕获文本单词序列的全局内部相关性,并进行进一步信息整合;图卷积神经网络模块,将GCN直接作用于句子依存关系树来建模句子结构,可将上下文和依赖信息从观点词传播到视角词;情感类别输出模块,用分类函数得到文本最终的情感分类结果。本发明可以有效发挥图卷积网络的作用,能够利用图卷积神经网络通过语义依赖树来建模句子结构,得到更好的文本情感特征表示。

    基于多任务稀疏共享学习的论辩挖掘系统及方法

    公开(公告)号:CN113641819A

    公开(公告)日:2021-11-12

    申请号:CN202110912198.0

    申请日:2021-08-10

    Applicant: 福州大学

    Abstract: 本发明提出一种基于多任务稀疏共享学习的论辩挖掘系统及方法,包括:编码器模块,用于使用双向长短时记忆神经网络学习上下文信息;双路注意力编码模块,用于使用自注意力和外部注意力并行对词向量进行特征提取,获得不同角度的单词语义关注度,强化单词之间的关系建模;稀疏共享学习模块,用于对获得句子向量的编码模块进行多任务学习,为不同任务生成任务特定的稀疏参数矩阵,以解决多任务学习负迁移影响,并获得句子级编码表示;多任务标签输出模块,用于使用任务特定的分类器完成不同任务的分类结果预测。能够自动地学习多个任务的稀疏共享结构,并利用各自任务特定的子网络进行联合训练,有效避免多任务学习的负迁移现象。

    基于分层异质图神经网络的社交媒体谣言检测方法及系统

    公开(公告)号:CN113515634A

    公开(公告)日:2021-10-19

    申请号:CN202110775965.8

    申请日:2021-07-09

    Applicant: 福州大学

    Abstract: 本发明涉及一种基于分层异质图神经网络的社交媒体谣言检测方法及系统,包括基于数据预处理模块,用于对文本数据进行预处理,抽取用户静态特征,构建分层异质图结构;事件编码模块,用于编码含有传播及扩散结构信息的文本;用户编码模块,用于学习用户行为特征;全局异质图编码模块,用于捕捉事件和用户之间丰富的全局结构信息;谣言检测标签输出模块,用于融合文本信息、用户行为特征、全局异质图信息,完成谣言检测的标签预测工作。本发明能够有效的学习用户与用户之间和文本与文本之间的局部内联关系,生成含有临近节点信息的用户、文本表示,以此建模学习用户与事件之间的全局结构关系,最终识别出事件的真实性。

    一种基于多类特征融合的新兴热点话题检测系统

    公开(公告)号:CN108399241B

    公开(公告)日:2021-08-31

    申请号:CN201810170864.6

    申请日:2018-02-28

    Applicant: 福州大学

    Abstract: 本发明涉及一种基于多类特征融合的新兴热点话题检测系统,包括:数据预处理模块,用于对微博文本进行预处理;分层序列模型,用于训练双向循环神经网络模型,通过使用双向的LSTM网络,训练输入的微博文本;词序列编码层,用于对句子中的各个词语向量化,形成初步的向量表示;句子级别特征求解层,用于对微博句子构建静态特征向量,与该层的神经网络动态特征进行链接,形成微博句子向量表示;话题级别特征求解层,用于对话题构建静态特征向量,与该层的神经网络动态特征进行链接,形成话题的向量表示;话题预测模块,用于对话题进行预测。本发明基于双向长短时期记忆网络架构,加入相应的动态特征和静态特征,提高新兴热点话题检测能力。

    一种基于词注意力机制的多输入LSTM_CNN文本分类方法及系统

    公开(公告)号:CN112507114A

    公开(公告)日:2021-03-16

    申请号:CN202011219283.0

    申请日:2020-11-04

    Applicant: 福州大学

    Abstract: 本发明涉及一种基于词注意力机制的多输入LSTM_CNN文本分类方法及系统,将给定的文本分为标题和正文,将其转换成向量形式;分别捕获标题与正文的双向语义依赖关系,得到标题与正文的双向语义特征;对正文的双向语义特征,采用注意力机制计算各个位置的词与分类任务的相关程度,对各个位置的双向语义特征进行注意力加权,得到正文的加权后的特征向量;对正文加权后的特征向量进行局部特征提取,从而得到正文的细粒度特征;将标题与正文的特征进行拼接,得到最终的文档级文本特征表示;对文本特征表示进行预测,得到文本所述的类别概率。本发明能够更好的识别出目标文本的归属类别。

    一种基于特征表示学习的跨领域情感分类方法及系统

    公开(公告)号:CN112199505A

    公开(公告)日:2021-01-08

    申请号:CN202011185607.3

    申请日:2020-10-30

    Applicant: 福州大学

    Abstract: 本发明涉及一种基于特征表示学习的跨领域情感分类方法及系统,包括步骤:对源领域文本与目标领域文本进行特征化处理,得到源领域初始文本向量与目标领域初始文本向量;将源领域初始文本向量与目标领域初始文本向量分别特征表示学习模块中,得到源领域文本特征向量与目标领域文本特征向量;将源领域文本特征向量与目标领域文本特征向量送入特征表示强化模块中,并进行训练;利用训练好的特征表示强化模块对目标领域的文本特征向量进行分类预测。本发明能够提升目标领域文本情感分类的效果。

    一种利用全量数据训练零样本图像分类方法

    公开(公告)号:CN110826639A

    公开(公告)日:2020-02-21

    申请号:CN201911099506.1

    申请日:2019-11-12

    Applicant: 福州大学

    Abstract: 本发明涉及一种利用全量数据训练零样本图像分类方法,包括以下步骤:步骤S1:将全量数据分为源数据和目标数据;步骤S2:将源数据集和目标数据集输入视觉特征网络,将原始图像映射到视觉特征空间,得到图像视觉特征向量;步骤S3:将原始图像的低维属性语义通过语义转换网络映射到高维,得到语义特征向量;步骤S4:根据得到的图像视觉特征向量和语义特征向量,利用视觉-属性语义衔接网络完成融合,得到拼接结果;步骤S5:根据拼接结果,通过得分子网络在语义空间中产生原始图像每一类的得分,并根据得分输出最终的预测结果。本发明能够有效的解决图像类别标签缺失问题。

Patent Agency Ranking