基于分布式处理和DPI数据构建用户网络数据指纹的方法和系统

    公开(公告)号:CN107832333B

    公开(公告)日:2022-05-10

    申请号:CN201710911155.4

    申请日:2017-09-29

    Abstract: 本发明公开了一种基于分布式处理框架和DPI数据的构建用户网络数据指纹的方法和系统,以提取出用户移动端上网行为特征及偏好。该系统包括:数据预处理模块:面向网络数据指纹的需求对原始数据进行清洗和去冗余;规则提取模块:选择M个常用手机APP,抓包得到每个APP的域名并正则匹配,将匹配式作为每个APP的识别规则并形成规则文件;用户集提取模块:提取网络数据指纹系统需要统计的用户集;用户行为提取模块:统计每单位时间段内用户对M个APP的访问情况;数据存储模块:将结果分区保存至数据仓库中,创建索引并备份。本发明通过描述用户移动端上网行为,建立起网络空间和现实生活的对应关系,为分析移动互联网用户行为提供便利,节省空间和时间资源。

    基于分布式处理和DPI数据构建用户网络数据指纹的方法和系统

    公开(公告)号:CN107832333A

    公开(公告)日:2018-03-23

    申请号:CN201710911155.4

    申请日:2017-09-29

    CPC classification number: G06F17/30867 H04L41/5064

    Abstract: 本发明公开了一种基于分布式处理框架和DPI数据的构建用户网络数据指纹的方法和系统,以提取出用户移动端上网行为特征及偏好。该系统包括:数据预处理模块:面向网络数据指纹的需求对原始数据进行清洗和去冗余;规则提取模块:选择M个常用手机APP,抓包得到每个APP的域名并正则匹配,将匹配式作为每个APP的识别规则并形成规则文件;用户集提取模块:提取网络数据指纹系统需要统计的用户集;用户行为提取模块:统计每单位时间段内用户对M个APP的访问情况;数据存储模块:将结果分区保存至数据仓库中,创建索引并备份。本发明通过描述用户移动端上网行为,建立起网络空间和现实生活的对应关系,为分析移动互联网用户行为提供便利,节省空间和时间资源。

Patent Agency Ranking