-
公开(公告)号:CN107102976A
公开(公告)日:2017-08-29
申请号:CN201710177559.5
申请日:2017-03-23
Applicant: 北京大学
Abstract: 本发明公开了一种基于微博的娱乐新闻自动构建技术与系统,涉及语言文字处理领域。目前社交媒体在互联网上十分流行,有大量的娱乐新闻从微博中诞生。基于微博的娱乐新闻构建主要分为两个阶段。第一阶段为对微博是否具有新闻价值进行判别,筛选出内容有意义、公众关注度高或者引发热烈讨论的微博,主要通过对微博提取特征然后使用随机森林进行分类预测来完成;第二阶段新闻生成阶段,对前一阶段过滤后得到的微博使用模板为主的方式构建新闻。在收集大量的微博数据并标注后,本系统通过以上两个阶段即可完成自动的娱乐新闻构建,既能生成丰富的用户关注的新闻,又能有效节省人力物力。