-
公开(公告)号:CN115225528A
公开(公告)日:2022-10-21
申请号:CN202210656146.6
申请日:2022-06-10
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出一种基于张量填充的网络流量数据分布式测量调度方法和系统,包括:将历史流量数据划分为T‑1周期和T周期,计算分布式网络中所有OD对关于T‑1周期和T周期的JS散度;把三维张量形式的网络数据使用CP分解得到三个因子矩阵,矩阵的每一行为一个因子,得到三个因子矩阵分别对应的三个因子集V1、V2、V3,根据OD对的JS散度进而得到V1和V2中每个因子的JS散度,综合V1和V2中每个因子的JS散度和方差,得到每个因子的重要度,选择重要度最高的因子和V3中因子构建线性方程,以采样一个样本,以所有采样样本构成的采集方案,对新数据进行采集,用历史采样数据和新采样数据共同确定的因子矩阵恢复出全量数据,作为分布式网络的流量测量结果。
-
公开(公告)号:CN117714377A
公开(公告)日:2024-03-15
申请号:CN202311686900.1
申请日:2023-12-11
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供加密网络流量识别模型、模型训练方法以及流量识别方法,所述识别模型为深度卷积神经网络,由至少N+1个卷积块顺序串行组成,每个卷积块由多个卷积层串行组成,每一个卷积层由若干个卷积元并列组成,其中:对于所述识别模型的前N个卷积块:所述卷积块中的一部分卷积元为局部卷积元;所述卷积块中的另一部分卷积元为全局卷积元;所述局部卷积元与所述全局卷积元之间的输入与输出无拼接或交叉;对于第N+1个卷积块:所述卷积块中的卷积元的输入为所述局部卷积元的输出与所述全局卷积元的输出的拼接;所述输入样本是根据流量数据PCAP文件中的数据包划分成的会话流得到的。本发明可以提高对加密流量的识别能力和识别的准确度。
-
公开(公告)号:CN119862480A
公开(公告)日:2025-04-22
申请号:CN202510026053.9
申请日:2025-01-08
Applicant: 中国科学院计算技术研究所
IPC: G06F18/2415 , H04L9/40 , G06F18/2431 , G06F18/15 , G06F18/213 , G06F18/25 , G06F18/214 , G06F18/21 , G06F18/22 , G06N3/045 , G06N3/0455 , G06N3/0895 , G06F123/00 , G06F123/02
Abstract: 本发明提供一种基于对比学习的加密网络流量分类模型及其训练方法,模型包括轻量级网络模块、分类器和特征提取器,特征提取器包括嵌入层和编码模块;方法包括,获取第一训练集,包括正样本和负样本,正样本包括从同一条加密流量中提取的时间特征和空间特征,负样本包括从两条不同加密流量中分别提取的时间特征和空间特征;利用第一训练集通过对比学习来预训练特征提取器学习时间特征和空间特征间的关系,得到预训练的特征提取器,获取第二训练集,其每个原始样本包括从同一条加密流量提取的时间特征和空间特征;冻结预训练的特征提取器的编码模块的参数,利用第二训练集训练模型根据加密流量的时间特征和空间特征进行流量分类,得到经训练的模型。
-
公开(公告)号:CN119862421A
公开(公告)日:2025-04-22
申请号:CN202510026071.7
申请日:2025-01-08
Applicant: 中国科学院计算技术研究所
IPC: G06F18/214 , H04L9/40 , G06F18/2431 , G06F18/2415 , G06F18/15 , G06F18/213 , G06F18/25 , G06F18/22 , G06N3/045 , G06N3/0455 , G06F123/00 , G06F123/02
Abstract: 本发明提供一种用于加密网络流量分类的数据集构建方法,包括:根据流量分类任务所需识别的多种类别,从网络中采集加密流量数据,得到流量数据文件,包括每种类别下的多个PCAP文件;基于流量数据文件确定若干条加密会话流量,包括每个PCAP文件中包含的一条或多条加密会话流量,每条会话流量包括通信双方交互时生成的若干数据包;根据每条会话流量的数据包,提取该条会话流量的多模态特征,其包括元数据特征、加密有效载荷字节特征和突发传输特征;根据若干条加密会话流量的多模态特征和每条加密会话流量所属的PCAP文件对应的类别,构建包括多个样本的数据集,每个样本包括根据每条会话流量的多模态特征构建的输入数据和指示该会话流量所属的类别的标签。
-
公开(公告)号:CN115225528B
公开(公告)日:2024-04-09
申请号:CN202210656146.6
申请日:2022-06-10
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出一种基于张量填充的网络流量数据分布式测量调度方法和系统,包括:将历史流量数据划分为T‑1周期和T周期,计算分布式网络中所有OD对关于T‑1周期和T周期的JS散度;把三维张量形式的网络数据使用CP分解得到三个因子矩阵,矩阵的每一行为一个因子,得到三个因子矩阵分别对应的三个因子集V1、V2、V3,根据OD对的JS散度进而得到V1和V2中每个因子的JS散度,综合V1和V2中每个因子的JS散度和方差,得到每个因子的重要度,选择重要度最高的因子和V3中因子构建线性方程,以采样一个样本,以所有采样样本构成的采集方案,对新数据进行采集,用历史采样数据和新采样数据共同确定的因子矩阵恢复出全量数据,作为分布式网络的流量测量结果。
-
公开(公告)号:CN117076063A
公开(公告)日:2023-11-17
申请号:CN202310603490.3
申请日:2023-05-25
Applicant: 中国科学院计算技术研究所
Abstract: 本发明实施例提供了一种网络数据包处理任务的定时执行方法,该方法包括:响应于预设的高频事件,获取高频事件的时间戳,其中,高频事件与网络数据包处理任务定时执行的时间粒度相匹配;基于高频事件的时间戳、网络数据包处理任务定时执行的预设起始时间以及执行周期对应的预设单位时间间隔,计算高频事件的时间戳所处的执行周期,并在高频事件的时间戳所处的执行周期为当前执行周期的下一执行周期时,执行网络数据包处理任务。本发明提高了网络数据包处理任务的执行时间精度,并且该方法不涉及对Linux操作系统的内核代码的修改,因此也具有很强的通用性,可以应用在不同的操作系统中执行周期性任务。
-
-
-
-
-