-
公开(公告)号:CN107784387A
公开(公告)日:2018-03-09
申请号:CN201710843010.5
申请日:2017-09-18
Applicant: 国家计算机网络与信息安全管理中心
CPC classification number: G06Q10/04 , G06F17/30675 , G06Q50/01
Abstract: 本发明公开了一种微博事件信息传播的连续动态预测方法,属于数据挖掘领域。针对新浪微博,在目前给定传播信息的基础上,试图预测下一阶段的微博总数量;按小时划分事件传播,利用事件从发生到当前时间段内传播特征,如微博量、参与人数、微博情绪等,基于GBDT模型预测下一小时内事件微博传播的总数。本发明预测模型中最优时间段长度和微博特征组合,是在全面衡量各特征的贡献度和相关性的基础上筛选出来的,不仅能够有效提高模型预测精度,平均模型精度超过70%,还能减小计算复杂性,避免无用计算,有效支持针对事件的预警和干预措施。
-
公开(公告)号:CN106227766A
公开(公告)日:2016-12-14
申请号:CN201610559551.0
申请日:2016-07-15
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F17/30
CPC classification number: G06F16/951
Abstract: 本发明公开了一种大数据驱动的选举舆情预测方法,属于数据挖掘领域。具体为:首先,根据选举国家或地区的互联网网路使用报告和地区网站排名,挑选出大数据信息源;再对每一类信息源进行分析,构建民意预测指标;然后融合提取出的多源预测指标,形成当前互联网民众支持率;进而收集民调报告,融合报告中各年龄段人群对候选人的支持率,形成线下民调支持率值;考虑选举国家或地区人口结构构成和网民年龄分布,融合候选人互联网支持率值与线下民调支持率值,运用移动平均方法,预测下一时间节点候选人支持率值,预测结果以日频度更新。本发明具有数据源广泛、预测周期短、实时性强等特点,在舆情监控和观点分析等领域有重要的应用价值。
-