一种面向网络评论的观点主题识别方法和系统

    公开(公告)号:CN101727487A

    公开(公告)日:2010-06-09

    申请号:CN200910227304.0

    申请日:2009-12-04

    Abstract: 本发明公开了一种面向网络评论的观点主题识别方法和系统,其方法包括步骤:a.文本输入,输入评论源和所有评论文本;b.文本预处理,对输入的文本进行词语切分和词性标注,去除停用词、标点符号和特定虚词,并统计词语的词频信息;c.主题词判决,计算词语权重值,如果词语权重值大于设定的阈值,则该词语判断为观点主题词;d.主题构建,将零散的观点主题词合并成为完整的观点主题;e.主题筛选,通过观点主题过滤确定有效的观点主题;本发明克服观点分析方法和系统的领域限制,不需构建本体库,从整体的角度识别观点主题,有效避开了单句观点分析存在的困难,在面对宽领域和随时间动态改变的网络评论数据实现自动识别短语模式的观点主题。

Patent Agency Ranking