一种融合用户时间信息的微博客用户影响力排名方法

    公开(公告)号:CN108460499B

    公开(公告)日:2022-03-08

    申请号:CN201810281738.8

    申请日:2018-04-02

    Applicant: 福州大学

    Abstract: 本发明涉及一种融合用户时间信息的微博客用户影响力排名方法,包括步骤:(1)对微博客用户进行特征化处理;(2)根据微博客用户特征对所有用户集进行聚类,得到微博客中的潜在有影响力用户集;(3)对潜在有影响力用户集构建特定话题领域下的张量影响力模型;(4)利用张量分解重构新的张量影响力模型;(5)根据重构的张量影响力模型预测用户的影响力得分;(6)根据用户的影响力得分从高到低排序,得到用户的影响力排名结果并输出。本发明方法可提高特定话题领域下用户影响力预测精度。

    一种融合话题属性和情感信息的文本数据观点摘要挖掘方法

    公开(公告)号:CN108287922B

    公开(公告)日:2022-03-08

    申请号:CN201810165734.3

    申请日:2018-02-28

    Applicant: 福州大学

    Abstract: 本发明提供一种融合话题属性和情感信息的文本数据观点摘要挖掘方法,包括:对话题的文本语料集进行预处理;输入话题语料集和背景语料集;提取话题语料集的话题属性;将得到的话题属性添加情感极性,对句子向量化;将得到的话题属性作为评价对象,得出句子包含的情感属性特征,通过话题属性和情感分析方法将一个句子进行特征向量化;利用得到的话题属性集合、文本句子特征向量集合S构建三层图结构,把所有文本句子聚类;从类簇中挑选句子组成观点摘要,挑选得分高的句子组成观点摘要。本发明使得采用提取话题属性方法提取的话题属性更为精准,同样使其不仅仅应用与中文微博领域,更可以用于网站新闻、商品评论领域。

    针对中文微博的观点分析原型系统

    公开(公告)号:CN108038205B

    公开(公告)日:2021-12-21

    申请号:CN201711344068.1

    申请日:2017-12-15

    Applicant: 福州大学

    Abstract: 本发明涉及一种针对中文微博的观点分析原型系统。包括:一中文微博数据预处理模块,用于将不同用户在不同话题下发表的微博及其评论文本进行对话序列级联、中文分词,得到词向量字典;一一致性挖掘模块,对用户‑观点、话题‑观点、用户‑文本和话题‑文本之间的一致性构建抽象向量,从全局的角度刻画中文微博的特征,利用四者之间的相互联系挖掘出隐含的文本语义和观点信息;一特征抽取模块,基于上下文和卷积神经网络模型从局部和全局的角度抽取出不同类型的特征,并根据误差不断更新参数;一分类结果输出模块,用分类函数得到最终的观点分析结果。本发明能够自动抽取出有效特征,并对特征进行抽象和组合,最终识别出中文微博的不同观点类别。

    基于话题簇动量模型的新兴热点话题检测系统及方法

    公开(公告)号:CN107895053B

    公开(公告)日:2021-09-24

    申请号:CN201711330329.4

    申请日:2017-12-13

    Applicant: 福州大学

    Abstract: 本发明提出一种针对社交媒体的动量模型的新兴热点话题检测系统及方法。该系统包括:一增量聚类算法,在于聚类出各个热点话题,为加速后面的人工标注过程;一正态分布累积概率求解,在于刻画话题的质量模型;一话题增长率求解过程,在于求解话题的速度模型;动态突发关键词的重叠率,用来衡量话题的新颖性;话题重要性衡量指标,使用话题用户和重要用户重叠率来衡量,为了衡量话题重要性;一个DBSCAN离群点检测算法,为了发现异常点来表示新兴热点话题。本发明能够利用社交媒介中数据的各维度作为特征,并刻画新兴热点话题的趋势,从而检测出新兴热点话题。

    一种融合用户时间信息的微博客用户影响力排名方法

    公开(公告)号:CN108460499A

    公开(公告)日:2018-08-28

    申请号:CN201810281738.8

    申请日:2018-04-02

    Applicant: 福州大学

    Abstract: 本发明涉及一种融合用户时间信息的微博客用户影响力排名方法,包括步骤:(1)对微博客用户进行特征化处理;(2)根据微博客用户特征对所有用户集进行聚类,得到微博客中的潜在有影响力用户集;(3)对潜在有影响力用户集构建特定话题领域下的张量影响力模型;(4)利用张量分解重构新的张量影响力模型;(5)根据重构的张量影响力模型预测用户的影响力得分;(6)根据用户的影响力得分从高到低排序,得到用户的影响力排名结果并输出。本发明方法可提高特定话题领域下用户影响力预测精度。

    一种融合话题属性和情感信息的文本数据观点摘要挖掘方法

    公开(公告)号:CN108287922A

    公开(公告)日:2018-07-17

    申请号:CN201810165734.3

    申请日:2018-02-28

    Applicant: 福州大学

    Abstract: 本发明提供一种融合话题属性和情感信息的文本数据观点摘要挖掘方法,包括:对话题的文本语料集进行预处理;输入话题语料集和背景语料集;提取话题语料集的话题属性;将得到的话题属性添加情感极性,对句子向量化;将得到的话题属性作为评价对象,得出句子包含的情感属性特征,通过话题属性和情感分析方法将一个句子进行特征向量化;利用得到的话题属性集合、文本句子特征向量集合S构建三层图结构,把所有文本句子聚类;从类簇中挑选句子组成观点摘要,挑选得分高的句子组成观点摘要。本发明使得采用提取话题属性方法提取的话题属性更为精准,同样使其不仅仅应用与中文微博领域,更可以用于网站新闻、商品评论领域。

    针对社交媒体的观点检索系统及方法

    公开(公告)号:CN108038204A

    公开(公告)日:2018-05-15

    申请号:CN201711343978.8

    申请日:2017-12-15

    Applicant: 福州大学

    Abstract: 本发明涉及一种针对社交媒体的观点检索系统及方法。包括:一文本实体链接模块,用于将用户查询和待查询文档进行分词处理,同时链接到指定的知识图谱,充分利用知识图谱中的实体间关系,增加系统对用户查询和文档的理解程度;一查询扩展模块,用于根据用户的查询,结合知识图谱实体描述文本,通过分类得到查询扩展词;一观点检索得分计算模块,用于结合原始查询和查询扩展词,分别计算用户查询与某一文档间的主题相关度得分部分,观点相关度得分部分,以及文档类别得分部分,并根据三个部分得到一个文档的综合得分;一文档排序输出模块,根据文档综合得分从高到低排序,得到查询的观点检索结果并输出。本发明能够高效准确地理解用户查询的信息需求,检索出与用户查询相关并带有对查询观点的文档。

    基于话题簇动量模型的新兴热点话题检测系统及方法

    公开(公告)号:CN107895053A

    公开(公告)日:2018-04-10

    申请号:CN201711330329.4

    申请日:2017-12-13

    Applicant: 福州大学

    CPC classification number: G06F17/30705 G06Q50/01

    Abstract: 本发明提出一种针对社交媒体的动量模型的新兴热点话题检测系统及方法。该系统包括:一增量聚类算法,在于聚类出各个热点话题,为加速后面的人工标注过程;一正态分布累积概率求解,在于刻画话题的质量模型;一话题增长率求解过程,在于求解话题的速度模型;动态突发关键词的重叠率,用来衡量话题的新颖性;话题重要性衡量指标,使用话题用户和重要用户重叠率来衡量,为了衡量话题重要性;一个DBSCAN离群点检测算法,为了发现异常点来表示新兴热点话题。本发明能够利用社交媒介中数据的各维度作为特征,并刻画新兴热点话题的趋势,从而检测出新兴热点话题。

    一种多记录网页的信息抽取系统及方法

    公开(公告)号:CN103761312B

    公开(公告)日:2017-02-08

    申请号:CN201410034376.4

    申请日:2014-01-24

    Applicant: 福州大学

    Abstract: 本发明涉及一种多记录网页的信息抽取系统及方法,该系统包括:一个网页预处理模块,用于将HTML网页转换为XHTML网页,并过滤网页中用来渲染显示效果的标签,然后根据标签的嵌套结构,构建文档次序树;一个记录区域定位模块,用于接收文档次序树,并利用横向层次分析法在文档次序树中定位出记录区域的位置;一个记录分隔符识别模块,用于从记录区域中找到记录之间的分隔符并进行存储;以及一个记录输出模块,用于将记录区域里所有文本节点按层次顺序遍历输出,在碰到分隔符时输出分隔线,得到最终的抽取结果。该系统及方法能够高效、准确地对传统和新式多记录网页进行信息抽取,抽取速度快、准确度高,通用性强,适用范围广。

Patent Agency Ranking