一种基于异质图随机游走的中文微博客观点探测方法

    公开(公告)号:CN104268230B

    公开(公告)日:2017-09-15

    申请号:CN201410504376.6

    申请日:2014-09-28

    Applicant: 福州大学

    Abstract: 本发明涉及一种基于异质图随机游走的中文微博客观点探测方法,包括:1、按话题采集微博,形成多个以话题为单位的微博集合;对微博进行预处理,去除噪声,形成词的集合的形式;2、从微博中识别出话题的关键词:计算每个词对于相应话题的权重,然后所有词根据权重的大小进行排序,将各话题中排序结果的前K个词作为相应话题的关键词;3、基于图模型探测微博中针对话题的主流观点:构建每条微博的特征向量,然后利用微博用户、微博和关键词之间的关系,以微博用户、微博、关键词为节点构建出微博图,再通过随机游走算法计算微博图中各节点的得分,最终得到针对各话题的微博的排序列表。该方法探测速度快、准确度高,通用性强,适用范围广。

    一种基于异质图随机游走的中文微博客观点探测方法

    公开(公告)号:CN104268230A

    公开(公告)日:2015-01-07

    申请号:CN201410504376.6

    申请日:2014-09-28

    Applicant: 福州大学

    CPC classification number: G06F17/30864

    Abstract: 本发明涉及一种基于异质图随机游走的中文微博客观点探测方法,包括:1、按话题采集微博,形成多个以话题为单位的微博集合;对微博进行预处理,去除噪声,形成词的集合的形式;2、从微博中识别出话题的关键词:计算每个词对于相应话题的权重,然后所有词根据权重的大小进行排序,将各话题中排序结果的前K个词作为相应话题的关键词;3、基于图模型探测微博中针对话题的主流观点:构建每条微博的特征向量,然后利用微博用户、微博和关键词之间的关系,以微博用户、微博、关键词为节点构建出微博图,再通过随机游走算法计算微博图中各节点的得分,最终得到针对各话题的微博的排序列表。该方法探测速度快、准确度高,通用性强,适用范围广。

Patent Agency Ranking