一种基于大数据并行运算的语音信箱业务数据分析方法

    公开(公告)号:CN105740397A

    公开(公告)日:2016-07-06

    申请号:CN201610058065.0

    申请日:2016-01-28

    CPC classification number: G06F16/182 G06F16/2471

    Abstract: 本发明提供一种基于大数据并行运算的语音信箱业务数据分析方法,通过flume日志收集系统把语音信箱平台业务系统的各核心组件抛出的结构化日志汇聚到hadoop离线集群;通过MapReduce将当天收集的原始日志生成或更新用户模型数据;用户模型数据反更新当天收集的日志生成相应的流水模型数据;查询最新的用户模型数据或者统计时间段内的流水模型数据得出统计分析结果。业务统计分析时,避免一次查询要处理整个数据集,既有效利用了大数据分析框架的并行运算能力又巧妙地避免了蛮干。本发明方法,减少了查询时间,提高了数据处理效率,适用于拥有海量的用户及业务数据的语音信箱系统。

Patent Agency Ranking