-
公开(公告)号:CN114036357A
公开(公告)日:2022-02-11
申请号:CN202111192489.3
申请日:2021-10-13
Applicant: 中国科学院信息工程研究所
IPC: G06F16/906 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明涉及一种基于类敏感特征提取的不均衡网络流量分类方法和系统。该方法的步骤包括:对原始不均衡流量数据中的每一条流进行向量化表示,得到向量化的流量数据集;采用神经网络进行类敏感特征学习,从通道层面学习得到对不同类别具有不同敏感度的特征表示;采用非局部机制将不同位置上的特征表示进行融合,得到重构后的流量特征表示;将重构后的流量特征表示输入分类器以进行网络流量分类。本发明无需任何数据预处理操作,也不需要对特征进行选择,避免了引入噪声或丢失流量信息;本发明可以针对每个类别学习最适合的特征表示,能够有针对性地提高少数类的表现,对不同任务场景所需要的不同初始特征具有鲁棒性。
-
公开(公告)号:CN112272147A
公开(公告)日:2021-01-26
申请号:CN202011148604.2
申请日:2020-10-23
Applicant: 中国科学院信息工程研究所
IPC: H04L12/851 , H04L12/803
Abstract: 本发明涉及一种基于代价敏感和梯度提升算法的不均衡网络流量分类方法和装置。该方法包括:采集当前任务场景下的网络流量,对其进行特征提取和标注,并划分训练集和验证集;设置参数池和目标指标;将训练集和验证集作为输入,根据设置的目标指标,采用梯度提升算法并通过交叉验证,对参数池中的参数进行自动化调优;将最佳参数组合代入分类器的相应位置,将训练集作为输入训练分类器,每一轮迭代产生的分类器采用验证集进行效果验证;采集不均衡网络流量数据,利用训练完成的不均衡网络流量分类器得到分类结果。本发明可以自适应调节参数,找到适合该场景的最佳参数,并训练能达到最佳目标指标的分类器,而无需了解数据分布的先验知识。
-
公开(公告)号:CN110519228A
公开(公告)日:2019-11-29
申请号:CN201910660771.6
申请日:2019-07-22
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开了一种黑产场景下恶意云机器人的识别方法及系统,以原始流量为对象进行分析,相比于Web服务器访问日志,最大程度上减少原始信息的损失,保留潜在的有用信息;同时,其多层流量统计特征提取模块既保护了用户隐私,又能提取恶意云机器人区别于正常用户的隐式特征,高准确率识别恶意云机器人。本发明主要针对薅羊毛、刷票等黑产场景,所述系统可以直接部署在企业的业务服务器端,识别恶意云机器人IP,减少经济损失;亦可帮助相关机关打击黑产犯罪。
-
公开(公告)号:CN110519228B
公开(公告)日:2020-12-04
申请号:CN201910660771.6
申请日:2019-07-22
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开了一种黑产场景下恶意云机器人的识别方法及系统,以原始流量为对象进行分析,相比于Web服务器访问日志,最大程度上减少原始信息的损失,保留潜在的有用信息;同时,其多层流量统计特征提取模块既保护了用户隐私,又能提取恶意云机器人区别于正常用户的隐式特征,高准确率识别恶意云机器人。本发明主要针对薅羊毛、刷票等黑产场景,所述系统可以直接部署在企业的业务服务器端,识别恶意云机器人IP,减少经济损失;亦可帮助相关机关打击黑产犯罪。
-
公开(公告)号:CN114036356A
公开(公告)日:2022-02-11
申请号:CN202111192487.4
申请日:2021-10-13
Applicant: 中国科学院信息工程研究所
IPC: G06F16/906 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明涉及一种基于对抗生成网络流量增强的不均衡流量分类方法和系统。该方法在原始的不平衡流量数据集上预训练一个经验最优的网络作为分类器的初始状态;然后对生成器、判别器和分类器进行同步训练;生成器对少数类流量进行过采样以生成流量样本,并输入判别器和分类器;判别器判断输入的流量样本是真实数据还是生成器生成的数据,并反馈给生成器以帮助其进行优化学习;分类器对网络流量进行分类并将分类结果反馈至生成器,使生成器生成更符合对应类别样本分布的流量样本;训练完成后分类器的输出结果即为不均衡流量分类结果。本发明避免了使用通用过采样算法造成的不适用于流量数据的弊端,可以在真实网络环境中实现对不均衡流量的有效分类。
-
-
-
-