一种利用表情符号对微博进行情感倾向分类的方法

    公开(公告)号:CN103761239B

    公开(公告)日:2016-10-26

    申请号:CN201310664725.6

    申请日:2013-12-09

    Abstract: 本发明公开了一种根据表情符号对微博进行情感倾向分类的方法,包括:创建中性情感集、消极情感集和积极情感集;利用中性情感集、消极情感集和积极情感集,建立中性情感贝叶斯分类器;利用由消极情感集和积极情感集,建立极性情贝叶斯情感分类器;利用中性情感贝叶斯分类器和极性情感贝叶斯分类器对待测微博进行情感分类。本发明通过建立一个两阶段分类,即建立中性情感分类器,把中性情感的微博剔除,建立极性情感分类器,将有极性情感的微博分为积极情感和消极情感,该分类器分类速度快、占用空间小且鲁棒,且本发明能通过微博准确的了解到人们对当前的热门话题或事件的态度和网民的情绪,对社会科研和调查有着重要的帮助。

    一种针对千万级规模新闻评论的观点挖掘方法

    公开(公告)号:CN104778209A

    公开(公告)日:2015-07-15

    申请号:CN201510111752.X

    申请日:2015-03-13

    Abstract: 本发明公开了一种针对千万级规模新闻评论的观点挖掘方法。具体步骤如下:1)、统计千万级规模新闻评论的数量;2)、判断该数量是否大于或等于阈值K,如果是不予处理,否则进入步骤三;3)、利用中文分词工具,对数量小于阈值K的新闻标题和评论进行分词,进行词性标注;4)、根据分词结果对新闻评论聚类,得到类别标签;5)、对新闻评论进行关键词对提取;6)、统计新闻评论的比例和混杂度;7)、根据关键词对筛选并提取代表性文本。本发明利用中文分词工具,考虑汉语语言的用法和搭配关系,结合新闻标题的作用,处理千万级规模的新闻评论,具有高效性、鲁棒性和易用性等优点。

    一种基于改进的PageRank的微博关键用户识别方法

    公开(公告)号:CN103530402A

    公开(公告)日:2014-01-22

    申请号:CN201310502924.7

    申请日:2013-10-23

    CPC classification number: G06F17/3089

    Abstract: 本发明公开了一种基于改进的PageRank的微博关键用户识别方法,包括输入微博信息数据,其中包括n条微博;对n条微博文本进行分词处理;根据分词结果建立倒排索引结构,便于根据指定关键词检索;根据检索到的相关微博提取其转发层级信息,构建加权有向图即转发网络G;将转发网络G划分为若干个极大连通子图Gi;利用并行化计算技术在每个子网络Gi应用PageRank算法;将各个子网络的计算结果融合生成整个网络生成整个网络G的排序结果;将排序结果选择前m条作为关键用户输出。本发明采用并行计算技术,在大数据环境下针对微博平台的动态转发网络进行排序计算,从而识别信息传播过程中的关键用户,应用于网络舆情分析等领域。

Patent Agency Ranking