一种基于Hadoop平台和分布式处理编程模型的TCP流重组方法

    公开(公告)号:CN104253863B

    公开(公告)日:2017-07-28

    申请号:CN201410468903.2

    申请日:2014-09-15

    Abstract: 本发明公开了一种基于Hadoop平台和分布式处理编程模型的TCP流重组方法,Map的输入键值对为 ,输出键值对为 。“+”操作表示将时间戳、序列号,数据包有效净荷部分拼成一个大的字节数组,并最终将“时间戳+序列号+数据包有效净荷”保存为Hadoop自带的BytesWritable数据类型。Map的输出经过Shuffle中间过程,完成对输出键值对的分区、排序、合并等过程。将Map输出中相同五元组的“时间戳+序列号+数据包有效净荷”聚集在一起形成键值对 作为Reduce的输入。最终Reduce的输出键值对为 。本发明提高了运行效率,减少了开销。

    一种基于Hadoop平台和分布式处理编程模型的TCP流重组方法

    公开(公告)号:CN104253863A

    公开(公告)日:2014-12-31

    申请号:CN201410468903.2

    申请日:2014-09-15

    Abstract: 本发明公开了一种基于Hadoop平台和分布式处理编程模型的TCP流重组方法,Map的输入键值对为 ,输出键值对为 。“+”操作表示将时间戳、序列号,数据包有效净荷部分拼成一个大的字节数组,并最终将“时间戳+序列号+数据包有效净荷”保存为Hadoop自带的BytesWritable数据类型。Map的输出经过Shuffle中间过程,完成对输出键值对的分区、排序、合并等过程。将Map输出中相同五元组的“时间戳+序列号+数据包有效净荷”聚集在一起形成键值对 作为Reduce的输入。最终Reduce的输出键值对为 。本发明提高了运行效率,减少了开销。

    一种基于DASH的全景视频自适应传输方法

    公开(公告)号:CN108235131B

    公开(公告)日:2020-07-03

    申请号:CN201810092135.3

    申请日:2018-01-30

    Abstract: 本发明涉及一种基于DASH的全景视频自适应传输方法,属于全景视频传输技术领域。该方法包括:建立三维全景视频与二维平面全景视频的映射关系模型,基于人体视觉和运动特性对全景视频进行区域优先级划分,服务器端将全景视频进行切片化,客户端带宽估计模块利用卡尔曼滤波算法进行预测可用带宽,客户端视频缓存模块基于缓存区状态对可用带宽进行平滑处理,客户端用户视窗感知模块基于运动惯性进行用户视窗预测,客户端决策模块综合考虑用户视窗、网络环境和缓存区状态自适应传输全景视频。相比传统视频传输方法,本发明综合考虑到了网络环境、缓存区状态以及用户视窗,提高了用户体验质量QoE。

    基于Hadoop平台的深度包检测系统及方法

    公开(公告)号:CN104156389A

    公开(公告)日:2014-11-19

    申请号:CN201410317160.9

    申请日:2014-07-04

    CPC classification number: G06F17/3089 G06F17/30545

    Abstract: 本发明公开一种基于Hadoop平台的深度包检测系统及方法,涉及数据挖掘技术,本发明包括网络爬虫部分和深度包检测部分,网络爬虫单元从互联网抓取页面,文件解析单元对网页进行分析得到统一资源定位符URL与网页分级内容的映射关系,不断迭代更新数据库中的映射关系库;深度包检测部分将原始数据解析成五元组流,输入TC模块,做业务流标记,生成特定业务流,将特定业务流转化成DPI事件,将DPI事件与映射关系库匹配,完成DPI事件统计。本发明将深度包检测技术集成到Hadoop平台,满足大数据存储与流量深度分析的需求。

    Web网站产品详细信息的分类抓取及产品信息库建立方法

    公开(公告)号:CN103927400A

    公开(公告)日:2014-07-16

    申请号:CN201410190477.0

    申请日:2014-05-07

    CPC classification number: G06F17/3089

    Abstract: 本发明针对Web网站产品信息的获取设计了一种网页抓取方法,首先抓取网站产品一级分类的首页,通过分析抓取的分类首页源文件,获取下一级产品分类首页链接;然后逐级抓取,直到网站所有分类首页抓取完毕;通过分析所有分类子页面的源文件,获取翻页元素和各分类页面数,然后生成各分类的子页面链接,最后根据各分类的子页面链接,完成各分类子页面的抓取。同时通过分析爬虫抓取的产品分类子页面源文件,提取产品详细信息和产品所属分类信息,建立网站产品id、分类id以及其他详细信息的映射关系,构建产品信息库。

    一种基于DASH的全景视频自适应传输方法

    公开(公告)号:CN108235131A

    公开(公告)日:2018-06-29

    申请号:CN201810092135.3

    申请日:2018-01-30

    Abstract: 本发明涉及一种基于DASH的全景视频自适应传输方法,属于全景视频传输技术领域。该方法包括:建立三维全景视频与二维平面全景视频的映射关系模型,基于人体视觉和运动特性对全景视频进行区域优先级划分,服务器端将全景视频进行切片化,客户端带宽估计模块利用卡尔曼滤波算法进行预测可用带宽,客户端视频缓存模块基于缓存区状态对可用带宽进行平滑处理,客户端用户视窗感知模块基于运动惯性进行用户视窗预测,客户端决策模块综合考虑用户视窗、网络环境和缓存区状态自适应传输全景视频。相比传统视频传输方法,本发明综合考虑到了网络环境、缓存区状态以及用户视窗,提高了用户体验质量QoE。

    基于Hadoop平台的深度包检测系统及方法

    公开(公告)号:CN104156389B

    公开(公告)日:2017-12-26

    申请号:CN201410317160.9

    申请日:2014-07-04

    Abstract: 本发明公开一种基于Hadoop平台的深度包检测系统及方法,涉及数据挖掘技术,本发明包括网络爬虫部分和深度包检测部分,网络爬虫单元从互联网抓取页面,文件解析单元对网页进行分析得到统一资源定位符URL与网页分级内容的映射关系,不断迭代更新数据库中的映射关系库;深度包检测部分将原始数据解析成五元组流,输入TC模块,做业务流标记,生成特定业务流,将特定业务流转化成DPI事件,将DPI事件与映射关系库匹配,完成DPI事件统计。本发明将深度包检测技术集成到Hadoop平台,满足大数据存储与流量深度分析的需求。

    Web网站产品详细信息的分类抓取及产品信息库建立方法

    公开(公告)号:CN103927400B

    公开(公告)日:2017-04-19

    申请号:CN201410190477.0

    申请日:2014-05-07

    Abstract: 本发明针对Web网站产品信息的获取设计了一种网页抓取方法,首先抓取网站产品一级分类的首页,通过分析抓取的分类首页源文件,获取下一级产品分类首页链接;然后逐级抓取,直到网站所有分类首页抓取完毕;通过分析所有分类子页面的源文件,获取翻页元素和各分类页面数,然后生成各分类的子页面链接,最后根据各分类的子页面链接,完成各分类子页面的抓取。同时通过分析爬虫抓取的产品分类子页面源文件,提取产品详细信息和产品所属分类信息,建立网站产品id、分类id以及其他详细信息的映射关系,构建产品信息库。

Patent Agency Ranking