-
公开(公告)号:CN104253863B
公开(公告)日:2017-07-28
申请号:CN201410468903.2
申请日:2014-09-15
Applicant: 重庆邮电大学
IPC: H04L29/08 , H04L12/861 , H04L1/16
Abstract: 本发明公开了一种基于Hadoop平台和分布式处理编程模型的TCP流重组方法,Map的输入键值对为 ,输出键值对为 。“+”操作表示将时间戳、序列号,数据包有效净荷部分拼成一个大的字节数组,并最终将“时间戳+序列号+数据包有效净荷”保存为Hadoop自带的BytesWritable数据类型。Map的输出经过Shuffle中间过程,完成对输出键值对的分区、排序、合并等过程。将Map输出中相同五元组的“时间戳+序列号+数据包有效净荷”聚集在一起形成键值对 作为Reduce的输入。最终Reduce的输出键值对为 。本发明提高了运行效率,减少了开销。
-
公开(公告)号:CN104253863A
公开(公告)日:2014-12-31
申请号:CN201410468903.2
申请日:2014-09-15
Applicant: 重庆邮电大学
IPC: H04L29/08 , H04L12/861 , H04L1/16
Abstract: 本发明公开了一种基于Hadoop平台和分布式处理编程模型的TCP流重组方法,Map的输入键值对为 ,输出键值对为 。“+”操作表示将时间戳、序列号,数据包有效净荷部分拼成一个大的字节数组,并最终将“时间戳+序列号+数据包有效净荷”保存为Hadoop自带的BytesWritable数据类型。Map的输出经过Shuffle中间过程,完成对输出键值对的分区、排序、合并等过程。将Map输出中相同五元组的“时间戳+序列号+数据包有效净荷”聚集在一起形成键值对 作为Reduce的输入。最终Reduce的输出键值对为 。本发明提高了运行效率,减少了开销。
-
公开(公告)号:CN103986606A
公开(公告)日:2014-08-13
申请号:CN201410227643.X
申请日:2014-05-27
Applicant: 重庆邮电大学
Abstract: 本发明公开了一种基于MapReduce算法的并行识别、统计网页URL的方法,包括步骤:将捕获的网络数据流量以block(块,默认大小64M)为单位分散存储在HDFS(分布式文件系统)中;提取URL之前,重组HTTP请求;执行Job1,从重组后的HTTP请求中并行提取URL;执行Job2,从提取出的URL中识别出页面URL。本方法提供了一种稳定、可靠、均匀且低成本的并行识别、统计网页URL的方法。
-
公开(公告)号:CN108235131B
公开(公告)日:2020-07-03
申请号:CN201810092135.3
申请日:2018-01-30
Applicant: 重庆邮电大学
IPC: H04N21/442 , H04N21/218 , H04N21/81 , H04N21/845 , H04N21/858 , H04N13/194 , H04N13/366 , H04N13/332
Abstract: 本发明涉及一种基于DASH的全景视频自适应传输方法,属于全景视频传输技术领域。该方法包括:建立三维全景视频与二维平面全景视频的映射关系模型,基于人体视觉和运动特性对全景视频进行区域优先级划分,服务器端将全景视频进行切片化,客户端带宽估计模块利用卡尔曼滤波算法进行预测可用带宽,客户端视频缓存模块基于缓存区状态对可用带宽进行平滑处理,客户端用户视窗感知模块基于运动惯性进行用户视窗预测,客户端决策模块综合考虑用户视窗、网络环境和缓存区状态自适应传输全景视频。相比传统视频传输方法,本发明综合考虑到了网络环境、缓存区状态以及用户视窗,提高了用户体验质量QoE。
-
公开(公告)号:CN104156389A
公开(公告)日:2014-11-19
申请号:CN201410317160.9
申请日:2014-07-04
Applicant: 重庆邮电大学
IPC: G06F17/30
CPC classification number: G06F17/3089 , G06F17/30545
Abstract: 本发明公开一种基于Hadoop平台的深度包检测系统及方法,涉及数据挖掘技术,本发明包括网络爬虫部分和深度包检测部分,网络爬虫单元从互联网抓取页面,文件解析单元对网页进行分析得到统一资源定位符URL与网页分级内容的映射关系,不断迭代更新数据库中的映射关系库;深度包检测部分将原始数据解析成五元组流,输入TC模块,做业务流标记,生成特定业务流,将特定业务流转化成DPI事件,将DPI事件与映射关系库匹配,完成DPI事件统计。本发明将深度包检测技术集成到Hadoop平台,满足大数据存储与流量深度分析的需求。
-
公开(公告)号:CN103927400A
公开(公告)日:2014-07-16
申请号:CN201410190477.0
申请日:2014-05-07
Applicant: 重庆邮电大学
IPC: G06F17/30
CPC classification number: G06F17/3089
Abstract: 本发明针对Web网站产品信息的获取设计了一种网页抓取方法,首先抓取网站产品一级分类的首页,通过分析抓取的分类首页源文件,获取下一级产品分类首页链接;然后逐级抓取,直到网站所有分类首页抓取完毕;通过分析所有分类子页面的源文件,获取翻页元素和各分类页面数,然后生成各分类的子页面链接,最后根据各分类的子页面链接,完成各分类子页面的抓取。同时通过分析爬虫抓取的产品分类子页面源文件,提取产品详细信息和产品所属分类信息,建立网站产品id、分类id以及其他详细信息的映射关系,构建产品信息库。
-
公开(公告)号:CN103986606B
公开(公告)日:2017-03-29
申请号:CN201410227643.X
申请日:2014-05-27
Applicant: 重庆邮电大学
Abstract: 本发明公开了一种基于MapReduce算法的并行识别、统计网页URL的方法,包括步骤:将捕获的网络数据流量以block(块,默认大小64M)为单位分散存储在HDFS(分布式文件系统)中;提取URL之前,重组HTTP请求;执行Job1,从重组后的HTTP请求中并行提取URL;执行Job2,从提取出的URL中识别出页面URL。本方法提供了一种稳定、可靠、均匀且低成本的并行识别、统计网页URL的方法。
-
公开(公告)号:CN108235131A
公开(公告)日:2018-06-29
申请号:CN201810092135.3
申请日:2018-01-30
Applicant: 重庆邮电大学
IPC: H04N21/442 , H04N21/218 , H04N21/81 , H04N21/845 , H04N21/858 , H04N13/194 , H04N13/366 , H04N13/332
Abstract: 本发明涉及一种基于DASH的全景视频自适应传输方法,属于全景视频传输技术领域。该方法包括:建立三维全景视频与二维平面全景视频的映射关系模型,基于人体视觉和运动特性对全景视频进行区域优先级划分,服务器端将全景视频进行切片化,客户端带宽估计模块利用卡尔曼滤波算法进行预测可用带宽,客户端视频缓存模块基于缓存区状态对可用带宽进行平滑处理,客户端用户视窗感知模块基于运动惯性进行用户视窗预测,客户端决策模块综合考虑用户视窗、网络环境和缓存区状态自适应传输全景视频。相比传统视频传输方法,本发明综合考虑到了网络环境、缓存区状态以及用户视窗,提高了用户体验质量QoE。
-
公开(公告)号:CN104156389B
公开(公告)日:2017-12-26
申请号:CN201410317160.9
申请日:2014-07-04
Applicant: 重庆邮电大学
IPC: G06F17/30
Abstract: 本发明公开一种基于Hadoop平台的深度包检测系统及方法,涉及数据挖掘技术,本发明包括网络爬虫部分和深度包检测部分,网络爬虫单元从互联网抓取页面,文件解析单元对网页进行分析得到统一资源定位符URL与网页分级内容的映射关系,不断迭代更新数据库中的映射关系库;深度包检测部分将原始数据解析成五元组流,输入TC模块,做业务流标记,生成特定业务流,将特定业务流转化成DPI事件,将DPI事件与映射关系库匹配,完成DPI事件统计。本发明将深度包检测技术集成到Hadoop平台,满足大数据存储与流量深度分析的需求。
-
公开(公告)号:CN103927400B
公开(公告)日:2017-04-19
申请号:CN201410190477.0
申请日:2014-05-07
Applicant: 重庆邮电大学
IPC: G06F17/30
Abstract: 本发明针对Web网站产品信息的获取设计了一种网页抓取方法,首先抓取网站产品一级分类的首页,通过分析抓取的分类首页源文件,获取下一级产品分类首页链接;然后逐级抓取,直到网站所有分类首页抓取完毕;通过分析所有分类子页面的源文件,获取翻页元素和各分类页面数,然后生成各分类的子页面链接,最后根据各分类的子页面链接,完成各分类子页面的抓取。同时通过分析爬虫抓取的产品分类子页面源文件,提取产品详细信息和产品所属分类信息,建立网站产品id、分类id以及其他详细信息的映射关系,构建产品信息库。
-
-
-
-
-
-
-
-
-