-
公开(公告)号:CN110519128A
公开(公告)日:2019-11-29
申请号:CN201910893976.9
申请日:2019-09-20
Applicant: 西安交通大学 , 北京神州绿盟信息安全科技股份有限公司
Abstract: 本发明公开了一种基于随机森林的操作系统识别方法,采用蒙特卡洛方法对指纹库进行随机抽样组合成训练集和测试集并进行向量化处理;采用分箱的方式进行数据钝化处理;基于设定的分层架构按照操作系统类别识别层、操作系统大版本号识别层和操作系统详细版本识别层,分别训练随机森林分类器,构建多棵决策树,每棵树用各自包外估计的测试精度高于设定的精度阈值,则加入到随机森林之中;分层架构局部增量训练,调参处理以提升模型精度;对真实探测流量进行识别预测,随机森林中的每棵树都给出一个分类结果,采用平权投票方式,选择票数最多的类别作为最终的预测结果。可有效识别未知指纹,提高识别的准确率。
-
公开(公告)号:CN110414594B
公开(公告)日:2021-09-07
申请号:CN201910673679.3
申请日:2019-07-24
Applicant: 西安交通大学 , 北京神州绿盟信息安全科技股份有限公司
Abstract: 本发明公开了一种基于双阶段判定的加密流量分类方法,将随机森林分类器分类的输出作为K近邻分类器的输入,最后对两种分类器结果进行融合比对,完成对流量数据的分类。本方法充分利用了随机森林算法的输出特性和双阶段判定的可靠性保证,可提高分类的准确率。本发明是基于双阶段的判定的加密流量分类算法。第一步将元特征序列通过训练之后可以得到第一阶段分类模型,即一个包含有k棵树的随机森林模型,然后取每一棵树的输出的标签作为一个新的复合特征向量,输入到K近邻分类器中进行第二阶段的分类,并且将两次分类之后的结果进行比对,只有两次分类的结果相同才算分类成功。这样的双阶段判定模型会使得最后的分类准确率显著提高。
-
公开(公告)号:CN111091194A
公开(公告)日:2020-05-01
申请号:CN201911109045.1
申请日:2019-11-13
Applicant: 西安交通大学 , 北京神州绿盟信息安全科技股份有限公司
IPC: G06N7/00
Abstract: 本发明公开了一种基于CAVWNB_KL算法的操作系统识别方法,分析nmap中的操作系统识别规则,从拆分出的大量数据集中抽出M万数据作为训练数据,同样的方法再次抽出m万数据作为模拟测试数据;将得到的M万数据进行封箱操作;使用KL散度计算属性与类之间的关联度作为每个属性的权值;将预处理过的M万数据计算先验概率和后验概率,作为指纹存储;取m万数据集计算出测试精度衡量指标;计算真实流量的测试精度;将采集到的真实流量进行筛选,以贝叶斯增量学习的方式增量训练,修正原有的指纹模型,完成识别。本发明采用CAVWNB_KL算法,极大的缓解了朴素贝叶斯属性间要求的独立的条件,提高了分类精度。
-
公开(公告)号:CN111091194B
公开(公告)日:2022-05-20
申请号:CN201911109045.1
申请日:2019-11-13
Applicant: 西安交通大学 , 北京神州绿盟信息安全科技股份有限公司
IPC: G06N7/00
Abstract: 本发明公开了一种基于CAVWNB_KL算法的操作系统识别方法,分析nmap中的操作系统识别规则,从拆分出的大量数据集中抽出M万数据作为训练数据,同样的方法再次抽出m万数据作为模拟测试数据;将得到的M万数据进行封箱操作;使用KL散度计算属性与类之间的关联度作为每个属性的权值;将预处理过的M万数据计算先验概率和后验概率,作为指纹存储;取m万数据集计算出测试精度衡量指标;计算真实流量的测试精度;将采集到的真实流量进行筛选,以贝叶斯增量学习的方式增量训练,修正原有的指纹模型,完成识别。本发明采用CAVWNB_KL算法,极大的缓解了朴素贝叶斯属性间要求的独立的条件,提高了分类精度。
-
公开(公告)号:CN110519128B
公开(公告)日:2021-02-19
申请号:CN201910893976.9
申请日:2019-09-20
Applicant: 西安交通大学 , 北京神州绿盟信息安全科技股份有限公司
Abstract: 本发明公开了一种基于随机森林的操作系统识别方法,采用蒙特卡洛方法对指纹库进行随机抽样组合成训练集和测试集并进行向量化处理;采用分箱的方式进行数据钝化处理;基于设定的分层架构按照操作系统类别识别层、操作系统大版本号识别层和操作系统详细版本识别层,分别训练随机森林分类器,构建多棵决策树,每棵树用各自包外估计的测试精度高于设定的精度阈值,则加入到随机森林之中;分层架构局部增量训练,调参处理以提升模型精度;对真实探测流量进行识别预测,随机森林中的每棵树都给出一个分类结果,采用平权投票方式,选择票数最多的类别作为最终的预测结果。可有效识别未知指纹,提高识别的准确率。
-
公开(公告)号:CN110414594A
公开(公告)日:2019-11-05
申请号:CN201910673679.3
申请日:2019-07-24
Applicant: 西安交通大学 , 北京神州绿盟信息安全科技股份有限公司
Abstract: 本发明公开了一种基于双阶段判定的加密流量分类方法,将随机森林分类器分类的输出作为K近邻分类器的输入,最后对两种分类器结果进行融合比对,完成对流量数据的分类。本方法充分利用了随机森林算法的输出特性和双阶段判定的可靠性保证,可提高分类的准确率。本发明是基于双阶段的判定的加密流量分类算法。第一步将元特征序列通过训练之后可以得到第一阶段分类模型,即一个包含有k棵树的随机森林模型,然后取每一棵树的输出的标签作为一个新的复合特征向量,输入到K近邻分类器中进行第二阶段的分类,并且将两次分类之后的结果进行比对,只有两次分类的结果相同才算分类成功。这样的双阶段判定模型会使得最后的分类准确率显著提高。
-
公开(公告)号:CN110263566B
公开(公告)日:2020-12-22
申请号:CN201910580763.0
申请日:2019-06-29
Applicant: 西安交通大学
Abstract: 本发明提供一种海量日志提权行为检测及分类方法,包括:海量日志提权行为检测和海量日志提权行为分类两大模块。通过提取历史日志中的多维度提权特征,在线检测海量流式日志中的权限提升行为;再将历史日志作为训练样本,学习产生分类模型,对检测出的所述权限提升行为给出更细粒度的分类结果。
-
公开(公告)号:CN110263566A
公开(公告)日:2019-09-20
申请号:CN201910580763.0
申请日:2019-06-29
Applicant: 西安交通大学
Abstract: 本发明提供一种海量日志提权行为检测及分类方法,包括:海量日志提权行为检测和海量日志提权行为分类两大模块。通过提取历史日志中的多维度提权特征,在线检测海量流式日志中的权限提升行为;再将历史日志作为训练样本,学习产生分类模型,对检测出的所述权限提升行为给出更细粒度的分类结果。
-
-
-
-
-
-
-