一种基于集成的多过滤式特征选择的网络流量分类方法

    公开(公告)号:CN115221949A

    公开(公告)日:2022-10-21

    申请号:CN202210747566.5

    申请日:2022-06-28

    Inventor: 陈雪娇 韩倩倩

    Abstract: 本发明提供了一种基于集成的多过滤式特征选择的网络流量分类方法,包括:对实时流量进行特征提取并进行预处理;采用基于集成的多过滤式特征选择算法获取最优特征子集,该方法结合卡方特征选择法、增益比特征选择法、relief特征选择法和信息增益特征选择法等四种单一的过滤式特征选择算法获取特征子集,使用简单多数投票的方法选取在四个特征子集中重复出现的特征作为最优特征子集;将最优特征子集划分为训练集和测试集,在CNN模型中基于训练集进行训练;再将测试集数据输入训练好的模型中,实现网络流量分类。本发明的方法可以完成对流量特征进行全面选择,避免重要特征的遗漏,并且保留较少的特征数目,从而提高分类模型的综合性能。

Patent Agency Ranking