一种基于分布式计算的互联网信息投放渠道优化系统

    公开(公告)号:CN104133837B

    公开(公告)日:2017-10-31

    申请号:CN201410289052.5

    申请日:2014-06-24

    Inventor: 张娅 魏逸 王宇晨

    Abstract: 本发明提供了一种基于分布式计算的互联网信息投放渠道优化系统,其中数据收集模块收集用户行为;数据预处理模块进行数据清理、集成、归约,将收集到的用户行为信息简单化,规范化;训练模块针对训练集中的数据,用类E‑M算法进行迭代运算,得到概率累加模型中的参数;再将测试集中的数据带入概率累加模型,从而完成对各个投放渠道的贡献预测以及对于用户是否转化的预测;对贡献度高的网站或推荐类型进行信息投放,并投放给那些最有可能发生转化的用户。同时,本发明使用Hadoop平台进行分布式计算,将消耗大量资源的复杂计算通过分布到多节点上进行计算,从而实现了多节点并行处理。

    一种基于分布式计算的互联网信息投放渠道优化系统

    公开(公告)号:CN104133837A

    公开(公告)日:2014-11-05

    申请号:CN201410289052.5

    申请日:2014-06-24

    Inventor: 张娅 魏逸 王宇晨

    CPC classification number: G06F17/3089 G06F9/4806

    Abstract: 本发明提供了一种基于分布式计算的互联网信息投放渠道优化系统,其中数据收集模块收集用户行为;数据预处理模块进行数据清理、集成、归约,将收集到的用户行为信息简单化,规范化;训练模块针对训练集中的数据,用类E-M算法进行迭代运算,得到概率累加模型中的参数;再将测试集中的数据带入概率累加模型,从而完成对各个投放渠道的贡献预测以及对于用户是否转化的预测;对贡献度高的网站或推荐类型进行信息投放,并投放给那些最有可能发生转化的用户。同时,本发明使用Hadoop平台进行分布式计算,将消耗大量资源的复杂计算通过分布到多节点上进行计算,从而实现了多节点并行处理。

Patent Agency Ranking