-
公开(公告)号:CN110414594A
公开(公告)日:2019-11-05
申请号:CN201910673679.3
申请日:2019-07-24
Applicant: 西安交通大学 , 北京神州绿盟信息安全科技股份有限公司
Abstract: 本发明公开了一种基于双阶段判定的加密流量分类方法,将随机森林分类器分类的输出作为K近邻分类器的输入,最后对两种分类器结果进行融合比对,完成对流量数据的分类。本方法充分利用了随机森林算法的输出特性和双阶段判定的可靠性保证,可提高分类的准确率。本发明是基于双阶段的判定的加密流量分类算法。第一步将元特征序列通过训练之后可以得到第一阶段分类模型,即一个包含有k棵树的随机森林模型,然后取每一棵树的输出的标签作为一个新的复合特征向量,输入到K近邻分类器中进行第二阶段的分类,并且将两次分类之后的结果进行比对,只有两次分类的结果相同才算分类成功。这样的双阶段判定模型会使得最后的分类准确率显著提高。
-
公开(公告)号:CN110414594B
公开(公告)日:2021-09-07
申请号:CN201910673679.3
申请日:2019-07-24
Applicant: 西安交通大学 , 北京神州绿盟信息安全科技股份有限公司
Abstract: 本发明公开了一种基于双阶段判定的加密流量分类方法,将随机森林分类器分类的输出作为K近邻分类器的输入,最后对两种分类器结果进行融合比对,完成对流量数据的分类。本方法充分利用了随机森林算法的输出特性和双阶段判定的可靠性保证,可提高分类的准确率。本发明是基于双阶段的判定的加密流量分类算法。第一步将元特征序列通过训练之后可以得到第一阶段分类模型,即一个包含有k棵树的随机森林模型,然后取每一棵树的输出的标签作为一个新的复合特征向量,输入到K近邻分类器中进行第二阶段的分类,并且将两次分类之后的结果进行比对,只有两次分类的结果相同才算分类成功。这样的双阶段判定模型会使得最后的分类准确率显著提高。
-
-
公开(公告)号:CN109194622A
公开(公告)日:2019-01-11
申请号:CN201810896859.3
申请日:2018-08-08
Applicant: 西安交通大学
IPC: H04L29/06
Abstract: 本发明公开了一种基于特征效率的加密流量分析特征选择方法,首先定义特征效率的计算方法F(f);然后两类样本上计算每个特征的特征效率,选择特征效率最大的一维特征,并且移除这维特征的值域交叠之外的样本,并记录移除的样本个数,如此循环,直到所有特征被计算完。然后根据预先规定的特征个数或者特征效率的阈值选择特征。本发明能够在给定最大特征集的前提下,有效的计算每个特征的特征效率,根据给定的特征效率阈值或者规定的特征数目筛选特征,有利于提高网站指纹识别技术的识别准确率,并且节省分类模型构建过程中消耗的时间和空间成本。
-
公开(公告)号:CN109104426A
公开(公告)日:2018-12-28
申请号:CN201810953642.1
申请日:2018-08-21
Applicant: 西安交通大学
IPC: H04L29/06
Abstract: 本发明公开了一种基于发包速率的加密流量分析防御方法,着眼于基于发包速率的防御方法,在互联网飞速发展与网络安全、个人隐私愈加被重视的背景下,基于发包速率的概率分布,提出一种在减少发包速率差异化的同时保证插入哑包所带来的额外带宽开销最小化,使得加密流量分析技术不能准确识别某一流量数据所代表的网络行为的防御方法。本发明充分挖掘发包速率的统计特性,应用于不同安全协议下的加密流量防御,具有很强的适应性和可行性。
-
公开(公告)号:CN113141363A
公开(公告)日:2021-07-20
申请号:CN202110438551.6
申请日:2021-04-22
Applicant: 西安交通大学
Abstract: 本发明公开了一种加密流量样本筛选方法、系统、设备及可读存储介质,通过以双向流的形式整合原始流量,同时筛选剔除无载荷的流并统一流量方向形成训练集,利用形成的训练集中的部分样本预训练原始分类模型得到初步分类模型,使用初步分类模型对训练集中其余训练样本中的部分训练样本进行预测得到预测概率,取预测概率值为0.45‑0.55的训练样本作为原始分类模型的训练样本对原始分类模型重新预训练,提高分类模型训练精度,基于不确定性的加密流量样本筛选方法的分类效果已经达到较好的预期,对最终的分类效果影响较小。这也从另一方面证明,使用本方法训练后得到的分类器并没有存在过拟合的现象,具有较好地泛化能力。
-
-
公开(公告)号:CN113194007B
公开(公告)日:2023-03-28
申请号:CN202110438552.0
申请日:2021-04-22
Applicant: 西安交通大学
IPC: H04L43/0876 , H04L43/0882 , H04L43/0894 , H04L45/00
Abstract: 本发明公开了一种网络可用带宽测量方法、系统、设备及可读存储介质,通过在源主机和目的主机之间构建包括基本队列和附加队列的探测包队列结构,采用双队列协同测量方法,在源主机上抓取并记录由附加队列诱发的ICMP超时响应包信息,根据源主机抓取的响应包信息,计算并记录每一跳相邻探测包对到达路由的时间差以及相邻路由由于排队导致的探测包对到达时间差变化,同时结合由源主机向目的主机传递此前计算的附加队列响应包时间数据,得到的每一跳路由造成的相邻探测包时间差变化,对可用带宽的估计值进行调整即可得到网络可用带宽,本发明通过评估探测队列在网络各路由排队对带宽估计模型的影响,进而更精确的估计网络路径的可用带宽。
-
公开(公告)号:CN113194007A
公开(公告)日:2021-07-30
申请号:CN202110438552.0
申请日:2021-04-22
Applicant: 西安交通大学
IPC: H04L12/26 , H04L12/733
Abstract: 本发明公开了一种网络可用带宽测量方法、系统、设备及可读存储介质,通过在源主机和目的主机之间构建包括基本队列和附加队列的探测包队列结构,采用双队列协同测量方法,在源主机上抓取并记录由附加队列诱发的ICMP超时响应包信息,根据源主机抓取的响应包信息,计算并记录每一跳相邻探测包对到达路由的时间差以及相邻路由由于排队导致的探测包对到达时间差变化,同时结合由源主机向目的主机传递此前计算的附加队列响应包时间数据,得到的每一跳路由造成的相邻探测包时间差变化,对可用带宽的估计值进行调整即可得到网络可用带宽,本发明通过评估探测队列在网络各路由排队对带宽估计模型的影响,进而更精确的估计网络路径的可用带宽。
-
公开(公告)号:CN108881305B
公开(公告)日:2020-04-28
申请号:CN201810897782.1
申请日:2018-08-08
Applicant: 西安交通大学
IPC: H04L29/06 , H04L29/08 , H04L12/851 , H04L9/32
Abstract: 本发明公开了一种面向加密流量识别的样本自动标定方法,提出基于TCP特性的流量拆分方法,从划分不同的应用程序为出发点,将流量拆分为多个不同的样本,借助代理服务器端的日志信息对流量数据进行解析和拆分,从而实现响应网络行为与流量数据的对应关系,即实现分类学习中的流量数据标定。本方法充分利用了应用层通信协议TCP的相关知识和代理服务器端的日志信息,可应用于真实场景下的加密流量识别。
-
-
-
-
-
-
-
-
-