用于主机入侵检测的系统调用序列数据增强方法

    公开(公告)号:CN115048442A

    公开(公告)日:2022-09-13

    申请号:CN202210536796.7

    申请日:2022-05-17

    Abstract: 本发明涉及一种用于主机入侵检测的系统调用序列数据增强方法,属于计算机与网络空间安全领域。本发明首先利用少数类样本构建系统调用序列对数据库;之后将序列数据转换成图结构数据,以更好地表征系统调用之间的关系;然后使用基于多头注意力机制的图转换网络和LSTM网络分别构建图编码器和序列解码器,学习系统调用序列行为语义中包含的时序依赖关系;最后,基于系统调用时序依赖关系循环生成少数类系统调用序列样本,以实现对少数类样本的数据增强。本发明能够弥补现有系统调用数据增强方法未充分挖掘利用序列信息,导致生成序列与原序列语义不一致的问题,生成反映样本序列关系的增强样本,有效提高主机入侵检测的检测准确率。

    融合多模态信息及权重张量的用户身份关联方法

    公开(公告)号:CN113222775B

    公开(公告)日:2022-08-05

    申请号:CN202110607064.8

    申请日:2021-05-28

    Abstract: 本发明涉及融合多模态信息及权重张量的用户身份关联方法,属于机器学习领域。主要为了解决目前用户身份关联方法中使用的用户信息单一,忽略其他模态信息和需要大量的标注数据的问题。本发明收集用户多模态特征信息并进行预处理,构建社交网络用户数据集;然后,使用规则匹配方法获得初始用户匹配矩阵和候选集过滤器;最后通过Transformer编码器和改进的基于权重张量分解的张量融合方法得到用户多模态特征的联合嵌入,使用Triplet Network结构迭代更新Transformer编码器权值,根据两个用户的联合嵌入表示相似性和设定的阈值判断两个用户是否匹配,输出最终用户匹配矩阵。

    一种结合API模糊处理技术的恶意软件对抗样本生成方法

    公开(公告)号:CN112231703B

    公开(公告)日:2022-08-05

    申请号:CN202011239328.0

    申请日:2020-11-09

    Abstract: 本发明涉及一种结合API模糊处理技术的恶意软件对抗样本生成方法,属于计算机与信息科学技术领域。本发明首先向原始的API调用序列中插入无关的API向量,初步实现恶意软件特征功能的混淆;然后对样本实施函数调用重定向的混淆操作,隐藏API的函数功能;最后,把修改后的样本馈送到恶意软件分类器,检查它是否实现了错误分类,利用遗传算法解决优化问题。本发明具有更高的实用性,更符合现实需求;相比于面向黑盒的对抗样本生成方法,本发明不仅没有破坏恶意软件原始的功能,而且在欺骗恶意软件分类器时具有高成功率,极大改善了无法平衡对抗样本欺骗成功率低和恶意软件功能被破坏的问题。

    二进制程序灰盒模糊测试的用例自适应生成方法

    公开(公告)号:CN114546827A

    公开(公告)日:2022-05-27

    申请号:CN202210039842.2

    申请日:2022-01-14

    Abstract: 本发明涉及二进制程序灰盒模糊测试的用例自适应生成方法,属于软件测试和漏洞挖掘领域。本发明提出一种新的用于衡量二进制编码序列差异的距离度量,用于计算已执行用例与每个候选种子的距离,旨在扩大不同长度编码序列之间的差异;同时,提出一种自适应用例执行效果的测试用例的生成方法和种子变异策略,若用例触发缺陷或新的程序执行路径,则选取与该用例距离最近的候选种子用例,并赋予该种子用例所用变异规则更高的权值,提高该规则后续被选取的可能性,否则选取距离最远的种子用例,采用原变异策略生成新用例。本发明提出一种解决软件模糊测试领域中测试用例的随机生成具有盲目性的方法,提高了用例生成的时间效率,能够发现更多软件缺陷。

    一种基于GAN的NDN网络入侵检测方法

    公开(公告)号:CN112235288B

    公开(公告)日:2022-05-17

    申请号:CN202011089853.9

    申请日:2020-10-13

    Abstract: 本发明涉及一种基于GAN的NDN网络入侵检测方法,属于计算机与信息科学技术领域。主目的是为了解决NDN网络中,统计方法泛化能力较差以及因恶意流量类样本数据过少,导致针对CPA攻击和IFA攻击的入侵检测困难的问题。本发明首先对从NDN网络路由节点获取的统计信息,使用变分高斯混合模型进行标准化预处理;其次使用基于条件GAN的方法对特定类别的样本进行数据增强,扩充表格型数据样本中恶意样本的数量;然后使用增强后的数据集训练深度神经网络分类器;最后分类器监测经由路由的流量统计信息判别恶意入侵攻击类型。本发明对CPA、IFA攻击监测效果较好。

    一种基于GAN的NDN网络入侵检测方法

    公开(公告)号:CN112235288A

    公开(公告)日:2021-01-15

    申请号:CN202011089853.9

    申请日:2020-10-13

    Abstract: 本发明涉及一种基于GAN的NDN网络入侵检测方法,属于计算机与信息科学技术领域。主目的是为了解决NDN网络中,统计方法泛化能力较差以及因恶意流量类样本数据过少,导致针对CPA攻击和IFA攻击的入侵检测困难的问题。本发明首先对从NDN网络路由节点获取的统计信息,使用变分高斯混合模型进行标准化预处理;其次使用基于条件GAN的方法对特定类别的样本进行数据增强,扩充表格型数据样本中恶意样本的数量;然后使用增强后的数据集训练深度神经网络分类器;最后分类器监测经由路由的流量统计信息判别恶意入侵攻击类型。本发明对CPA、IFA攻击监测效果较好。

    一种结合API模糊处理技术的恶意软件对抗样本生成方法

    公开(公告)号:CN112231703A

    公开(公告)日:2021-01-15

    申请号:CN202011239328.0

    申请日:2020-11-09

    Abstract: 本发明涉及一种结合API模糊处理技术的恶意软件对抗样本生成方法,属于计算机与信息科学技术领域。本发明首先向原始的API调用序列中插入无关的API向量,初步实现恶意软件特征功能的混淆;然后对样本实施函数调用重定向的混淆操作,隐藏API的函数功能;最后,把修改后的样本馈送到恶意软件分类器,检查它是否实现了错误分类,利用遗传算法解决优化问题。本发明具有更高的实用性,更符合现实需求;相比于面向黑盒的对抗样本生成方法,本发明不仅没有破坏恶意软件原始的功能,而且在欺骗恶意软件分类器时具有高成功率,极大改善了无法平衡对抗样本欺骗成功率低和恶意软件功能被破坏的问题。

    一种利用局部嵌入话题建模的文本表示方法

    公开(公告)号:CN107220311B

    公开(公告)日:2020-12-08

    申请号:CN201710332228.4

    申请日:2017-05-12

    Abstract: 本发明涉及一种利用局部嵌入话题建模的文本表示方法,属于计算机科学与信息检索技术领域。在该方法中,根据文本在词空间的欧氏距离选取近邻集,构造局部加权正则项,把正则项加入传统的自编码网络进行训练获得模型,进而构造一个显示映射函数,并最终利用编码网络抽取样本外文档的向量表示。本发明引入局部加权正则项,有效地保持文本所在空间的内部固有几何结构。此外,本发明生成了一个观测空间和低维流形之间的显式嵌入映射,提供了一种从样本外文本提取嵌入向量表示的简便方法。

    使用控制变异的模糊测试覆盖率改进方法

    公开(公告)号:CN107193731B

    公开(公告)日:2020-10-27

    申请号:CN201710331793.9

    申请日:2017-05-12

    Abstract: 本发明涉及提高模糊测试覆盖率的测试用例控制变异生成方法,属于信息安全的漏洞挖掘领域。本发明针对目前优化模糊测试覆盖率方法时间代价高、测试范围不完整和自动化程度低等问题,提出一种控制变异生成测试用例的方法。本方法利用插桩技术对测试用例生成过程进行反馈,结合随机变异和控制变异方式优化测试用例生成。实验结果表明,相比于未优化的模糊测试方法,方法使代码覆盖率提高了35%~47%,相同代码覆盖率下所需测试用例数减少了48%以上。方法不但提高了测试用例覆盖率和减小了测试用例冗余,而且具有时间代价低、测试范围完整和测试过程无需人工干预的特点。

    基于LightGBM的关键信息基础设施类型单位归属判定方法

    公开(公告)号:CN110334904A

    公开(公告)日:2019-10-15

    申请号:CN201910459822.9

    申请日:2019-05-30

    Abstract: 本发明涉及基于LightGBM的关键信息基础设施类型单位归属判定方法,属于网络空间安全与机器学习领域。主要为了解决传统的依赖人力对关键信息基础设施类型进行标注的效率低、可扩展性差的问题。本发明提出一种基于机器学习算法,结合多类型、多截面数据采集及特征表达的关键信息基础设施资产特征优化表达与多目标分类技术研究方法,在此基础上构建关键信息基础设施类型归属判别应用系统,根据设施资产数据判定其属于哪一类的关键信息基础设施(如政府机关、国防科工、广播电台、运营商等等),实现对关键信息基础设施类型归属的识别认定。实验结果表明,本发明提出的算法的准确率和查全率较好,与规则匹配方法相比,具有很好的判定效果。

Patent Agency Ranking