-
公开(公告)号:CN104133837B
公开(公告)日:2017-10-31
申请号:CN201410289052.5
申请日:2014-06-24
Applicant: 上海交通大学
IPC: G06F17/30
Abstract: 本发明提供了一种基于分布式计算的互联网信息投放渠道优化系统,其中数据收集模块收集用户行为;数据预处理模块进行数据清理、集成、归约,将收集到的用户行为信息简单化,规范化;训练模块针对训练集中的数据,用类E‑M算法进行迭代运算,得到概率累加模型中的参数;再将测试集中的数据带入概率累加模型,从而完成对各个投放渠道的贡献预测以及对于用户是否转化的预测;对贡献度高的网站或推荐类型进行信息投放,并投放给那些最有可能发生转化的用户。同时,本发明使用Hadoop平台进行分布式计算,将消耗大量资源的复杂计算通过分布到多节点上进行计算,从而实现了多节点并行处理。
-
公开(公告)号:CN104133837A
公开(公告)日:2014-11-05
申请号:CN201410289052.5
申请日:2014-06-24
Applicant: 上海交通大学
IPC: G06F17/30
CPC classification number: G06F17/3089 , G06F9/4806
Abstract: 本发明提供了一种基于分布式计算的互联网信息投放渠道优化系统,其中数据收集模块收集用户行为;数据预处理模块进行数据清理、集成、归约,将收集到的用户行为信息简单化,规范化;训练模块针对训练集中的数据,用类E-M算法进行迭代运算,得到概率累加模型中的参数;再将测试集中的数据带入概率累加模型,从而完成对各个投放渠道的贡献预测以及对于用户是否转化的预测;对贡献度高的网站或推荐类型进行信息投放,并投放给那些最有可能发生转化的用户。同时,本发明使用Hadoop平台进行分布式计算,将消耗大量资源的复杂计算通过分布到多节点上进行计算,从而实现了多节点并行处理。
-