-
公开(公告)号:CN110334904B
公开(公告)日:2023-03-03
申请号:CN201910459822.9
申请日:2019-05-30
Applicant: 北京理工大学
IPC: G06F16/84
Abstract: 本发明涉及基于LightGBM的关键信息基础设施类型单位归属判定方法,属于网络空间安全与机器学习领域。主要为了解决传统的依赖人力对关键信息基础设施类型进行标注的效率低、可扩展性差的问题。本发明提出一种基于机器学习算法,结合多类型、多截面数据采集及特征表达的关键信息基础设施资产特征优化表达与多目标分类技术研究方法,在此基础上构建关键信息基础设施类型归属判别应用系统,根据设施资产数据判定其属于哪一类的关键信息基础设施(如政府机关、国防科工、广播电台、运营商等等),实现对关键信息基础设施类型归属的识别认定。实验结果表明,本发明提出的算法的准确率和查全率较好,与规则匹配方法相比,具有很好的判定效果。
-
公开(公告)号:CN110245693A
公开(公告)日:2019-09-17
申请号:CN201910459868.0
申请日:2019-05-30
Applicant: 北京理工大学
Abstract: 本发明公开了一种结合混合随机森林的关键信息基础设施资产识别方法,属于计算机与信息科学技术领域。该方法包括:对采集到的设施资产数据进行结构化处理并进行特征优化表达,得到扩展的特征向量;结合德尔菲专家咨询法和主成分分析法,进行资产设施的关键影响因素分析,提取关键特征向量;将多个随机森林判别模型与一个门控函数相结合,获得混合随机森林判决模型;基于构建的混合随机森林模型实现对流量是否为关键资产基础设施的识别。由于本发明提供的关键信息基础设施资产识别方法,在大数据下通过结合机器学习方法实现资产的特征构建和关键因素提取,通过分区构建各自的专家模型,提升识别的准确性和效率,并提高了模型的泛化能力和可扩展性。
-
公开(公告)号:CN110245693B
公开(公告)日:2023-04-07
申请号:CN201910459868.0
申请日:2019-05-30
Applicant: 北京理工大学
IPC: G06F18/2431 , G06F18/2411 , G06Q10/0639 , G06Q50/26
Abstract: 本发明公开了一种结合混合随机森林的关键信息基础设施资产识别方法,属于计算机与信息科学技术领域。该方法包括:对采集到的设施资产数据进行结构化处理并进行特征优化表达,得到扩展的特征向量;结合德尔菲专家咨询法和主成分分析法,进行资产设施的关键影响因素分析,提取关键特征向量;将多个随机森林判别模型与一个门控函数相结合,获得混合随机森林判决模型;基于构建的混合随机森林模型实现对流量是否为关键资产基础设施的识别。由于本发明提供的关键信息基础设施资产识别方法,在大数据下通过结合机器学习方法实现资产的特征构建和关键因素提取,通过分区构建各自的专家模型,提升识别的准确性和效率,并提高了模型的泛化能力和可扩展性。
-
公开(公告)号:CN113238957B
公开(公告)日:2022-08-05
申请号:CN202110607268.1
申请日:2021-05-28
Applicant: 北京理工大学
Abstract: 本发明涉及智能化场景下流量监测系统的测试样本生成方法,属于计算机与信息科学技术领域。主要是为了解决现有的智能化场景下流量监测系统的测试样本生成方法存在未考虑神经元组合作用影响和生成条件严苛难以应用于实际测试的问题。本发明首先,构造一组种子测试集和三种变异模型,同时初始化组合覆盖列表;其次,对随机选择的一个种子测试,最大化原模型和变异模型结果置信度的差异性;接着,选择未达成组合覆盖条件的三元组,最小化使下层神经元发生状态转换的两个上层神经元的变动距离;最后,对以上两步进行联合优化,使用梯度上升算法求解,构造测试数据,并通过模型差异检测判断是否保留。重复执行如上步骤,直到种子数据集为空。
-
公开(公告)号:CN110334904A
公开(公告)日:2019-10-15
申请号:CN201910459822.9
申请日:2019-05-30
Applicant: 北京理工大学
Abstract: 本发明涉及基于LightGBM的关键信息基础设施类型单位归属判定方法,属于网络空间安全与机器学习领域。主要为了解决传统的依赖人力对关键信息基础设施类型进行标注的效率低、可扩展性差的问题。本发明提出一种基于机器学习算法,结合多类型、多截面数据采集及特征表达的关键信息基础设施资产特征优化表达与多目标分类技术研究方法,在此基础上构建关键信息基础设施类型归属判别应用系统,根据设施资产数据判定其属于哪一类的关键信息基础设施(如政府机关、国防科工、广播电台、运营商等等),实现对关键信息基础设施类型归属的识别认定。实验结果表明,本发明提出的算法的准确率和查全率较好,与规则匹配方法相比,具有很好的判定效果。
-
公开(公告)号:CN113238957A
公开(公告)日:2021-08-10
申请号:CN202110607268.1
申请日:2021-05-28
Applicant: 北京理工大学
Abstract: 本发明涉及智能化场景下流量监测系统的测试样本生成方法,属于计算机与信息科学技术领域。主要是为了解决现有的智能化场景下流量监测系统的测试样本生成方法存在未考虑神经元组合作用影响和生成条件严苛难以应用于实际测试的问题。本发明首先,构造一组种子测试集和三种变异模型,同时初始化组合覆盖列表;其次,对随机选择的一个种子测试,最大化原模型和变异模型结果置信度的差异性;接着,选择未达成组合覆盖条件的三元组,最小化使下层神经元发生状态转换的两个上层神经元的变动距离;最后,对以上两步进行联合优化,使用梯度上升算法求解,构造测试数据,并通过模型差异检测判断是否保留。重复执行如上步骤,直到种子数据集为空。
-
公开(公告)号:CN112422505A
公开(公告)日:2021-02-26
申请号:CN202011090699.7
申请日:2020-10-13
Applicant: 北京理工大学
IPC: H04L29/06
Abstract: 本发明涉及基于高维扩展关键特征向量的网络恶意流量识别方法,属于计算机与信息科学技术领域。本发明首先对网络流量数据进行数据清洗和特征优化表达,采用特征分割与融合的方法从关键字、时段节点、行为组合三个方面构建特征,并进行归一化和标准化处理,获得关键词特征向量、时段特征向量、行为特征向量,顺序拼接获得高维扩展特征向量;然后结合专家调查法和因子分析法,进行关键影响因素分析,得到特征权重集,剔除冗余特征和混淆特征,提取关键特征向量;最后,对训练好的决策树进行AUC值计算和相似度计算,保留效果最好的决策树构建随机森林模型,实现对网络恶意流量的自动化识别和检测。
-
-
-
-
-
-