-
公开(公告)号:CN110543590A
公开(公告)日:2019-12-06
申请号:CN201910061262.1
申请日:2019-01-23
Applicant: 北京信息科技大学
IPC: G06F16/951 , G06F16/953 , G06F16/9535 , G06F16/35 , G06F16/33
Abstract: 本发明公开了一种微博突发事件的检测方法,包括:步骤1,对去除噪声和分词处理后的微博数据进行时间划分,获得与时间窗口对应的微博数据集;步骤2,计算各时间窗口包含的所有微博中各词w的突发词判断权重Wk(w),将Wk(w)大于突发词阈值的词作为突发词,从而获得各时间窗口的突发词集;步骤3,基于突发词集中两两突发词的耦合度,利用聚类算法对突发词集中突发词进行聚类,并基于聚类结果检测时间窗口的突发事件。和现有方法相比,本发明基于突发特征词的微博突发事件的检测方法在准确率和F值上有了很大的提升,即检测结果更准确。