-
公开(公告)号:CN101252541B
公开(公告)日:2011-05-04
申请号:CN200810103622.1
申请日:2008-04-09
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供一种网络流量分类模型的建立方法,包括:从所捕获的网络流量的的流数据包中选择和提取识别指标;根据识别指标,在所设定的若干不同的簇数目下,选择初始化簇中心;在所设定的若干不同的簇数目下,分别根据初始化簇中心,对识别指标进行分簇操作,并重新计算新的簇中心点;在所设定的若干不同的簇数目下,分别计算各个分簇操作结果的标准化互信息值,根据标准化互信息值从所设定的若干不同的簇数目中选择一个作为最佳簇数目;根据所得到的最佳簇数目,选择最佳簇数目下的分簇操作结果和新的簇中心点作为网络流量分类模型。本发明通过NMI值的计算来验证簇数目的选择是否合适,并通过对最佳簇数目的选择得到较好的聚类特征,较高的识别精度。
-
公开(公告)号:CN101252541A
公开(公告)日:2008-08-27
申请号:CN200810103622.1
申请日:2008-04-09
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供一种网络流量分类模型的建立方法,包括:从所捕获的网络流量的流数据包中选择和提取识别指标;根据识别指标,在所设定的多个簇数目下,选择初始化簇中心;在所设定的多个簇数目下,分别根据初始化簇中心,对识别指标进行分簇操作,并重新计算新的簇中心点;在所设定的多个簇数目下,分别计算各个分簇操作结果的标准化互信息值,根据标准化互信息值从所设定的多个簇数目中选择一个作为最佳簇数目;根据所得到的最佳簇数目,选择最佳簇数目下的分簇操作结果和新的簇中心点作为网络流量分类模型。本发明通过NMI值的计算来验证簇数目的选择是否合适,并通过对最佳簇数目的选择得到较好的聚类特征,较高的识别精度。
-