-
公开(公告)号:CN114881172A
公开(公告)日:2022-08-09
申请号:CN202210614135.1
申请日:2022-05-31
Applicant: 燕山大学
IPC: G06K9/62 , G06F40/289 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于加权词向量和神经网络的软件漏洞自动分类方法,属于计算机软件安全领域,包括以下步骤:S1,对漏洞详细描述文本的数据预处理;S2,漏洞文本经过预处理后,通过Word2Vec模型和N‑TF‑IDF算法结合构造加权词向量,完成文本向量表示;S3,基于神经网络的TCNN‑BiGRU漏洞分类模型实现漏洞自动分类,模型主要包括4个部分,分别为输入层、TextCNN结构、BiGRU结构和全连接层。本发明能够满足对软件漏洞的自动化分类需求,且不受漏洞数量和漏洞种类增多的限制,有效地处理词向量空间的高维性和稀疏性问题,在准确率、宏精确率、宏召回率和宏F1值等多维评价指标中表现出较好性能。
-
公开(公告)号:CN113901472A
公开(公告)日:2022-01-07
申请号:CN202111047801.X
申请日:2021-09-08
Applicant: 燕山大学
Abstract: 本发明公开了一种双粒度轻量级的漏洞代码切片质量评估方法,属于信息安全技术领域,包括以下步骤:分类、预处理漏洞代码切片样本;使用窗口的单词、字符不同粒度,分割代码切片;建立评估特征向量;计算代码切片统计特征,建立切片数据集;建立轻量级评估模型;将切片数据集输入到轻量级评估模型,输出评估特征及评估指标。本发明通过单词、字符级别多种大小窗口分割代码切片,使用统计特征构建漏洞检测向量空间,提取代码切片中内隐的漏洞特征,解决了基于代码切片的漏洞检测技术中存在的未登录词嵌入问题,构建异质集成的轻量级评估模型,输出评估特征与多维评估指标,替代传统技术中的黑盒模型,提高了研究人员代码切片方法的研发、迭代效率。
-
公开(公告)号:CN113901448A
公开(公告)日:2022-01-07
申请号:CN202111030448.4
申请日:2021-09-03
Applicant: 燕山大学
Abstract: 本发明公开了一种基于卷积神经网络和轻量级梯度提升机的入侵检测方法,涉及网络安全领域的入侵检测技术,包括:数据预处理:在数据预处理的过程包括数据类型转换、过采样技术和图像数据转换;特征选择:使用CNN模型选择特征;入侵检测分类:使用LightGBM算法做分类。本发明克服了数据不平衡性、高维性和非线性给入侵检测分析带来的困难,从而在准确率、精确率、漏报率等多维评价指标中表现出较好性能。
-
公开(公告)号:CN109886020A
公开(公告)日:2019-06-14
申请号:CN201910068001.2
申请日:2019-01-24
Applicant: 燕山大学
Abstract: 本申请提供一种基于深度神经网络的软件漏洞自动分类方法,包括:S1,对漏洞信息进行预处理后形成词集列表;S2,对样本漏洞描述信息集合使用TF-IDF算法和IG算法对每个词的权重进行计算,获取重要特征词集列表;S3,根据重要特征词集列表生成词向量空间,把每一条漏洞描述信息表述成一个m维的向量,m是重要特征词集中特征词的数量;S4,使用DNN模型获得软件漏洞分类器;S5,新的漏洞描述信息集合进行分类。本发明基于TF-IDF和IG算法构建深度神经网络漏洞自动分类模型,降低了高维词向量空间的维度,能够适应不断更新的软件漏洞数据集,有效地处理词向量空间的高维性和稀疏性,在准确率、召回率、精度等多维评价指标中表现出较好性能。
-
公开(公告)号:CN119227685A
公开(公告)日:2024-12-31
申请号:CN202411230850.0
申请日:2024-09-04
Applicant: 燕山大学
IPC: G06F40/295 , G06F40/30 , G06N3/0455 , G06N3/0464
Abstract: 本发明公开了基于层叠网格结构信息增强的中文命名实体识别方法,属于自然语言处理、命名实体识别技术领域,本发明使用层叠网格结构和层次化压缩感知模块对词向量的引入和无损压缩,避免了长输入序列和信息损失,同时还将词汇融合过程和上下文特征编码过程进行解耦来减少不必要的注意力计算,提升了计算效率;引入汉字的字形结构信息作为补充,通过多重交叉注意力挖掘实体在字形、字符和单词多个粒度上的关联性,增强了文本的上下文表示能力;使用基于双联协同的实体识别方法,通过软标签约束和多任务联合评分函数实现了跨度抽取与标签分类间的协同学习,并利用全量样本完成标签分类训练,减少了跨度抽取错误造成的错误传播,提升了识别准确率。
-
公开(公告)号:CN113901449B
公开(公告)日:2023-08-15
申请号:CN202111045622.2
申请日:2021-09-07
Applicant: 燕山大学
Abstract: 本发明公开了基于静态和动态执行的二阶SQL注入漏洞的防御和检测方法,包括静态分析模块和动态执行模块,静态分析模块对SQL语句添加标识符;动态执行模块作用于web应用执行过程中,用于解析静态分析模块添加的标识符,识别出SQL语句中包含的攻击字符,并使用字符转义或字符截取的手段对其进行防御。本发明通过混合静态分析和基于代理的动态执行的方法,实现通用的对二阶SQL注入漏洞的检测防御,提高检测的准确性,误报率较低,保护web应用和其后台数据库的安全。
-
公开(公告)号:CN113901463B
公开(公告)日:2023-06-30
申请号:CN202111033119.5
申请日:2021-09-03
Applicant: 燕山大学
IPC: G06F21/56 , G06F18/214 , G06N20/20
Abstract: 本发明公开了一种面向概念漂移的可解释Android恶意软件检测方法,属于信息安全技术领域,包括通过人工Android恶意软件分析报告引入检测特征,基于自动化机器学习算法与可解释算法改进传统的特征包装,并融合同分布检验与迁移学习算法。本发明提高了Android恶意软件检测模型的可解释性,有利于逆向分析人员人工验证检测模型,降低了概念漂移问题对检测模型准确率影响,有利于检测模型低代价的长时间维持高准确率,用于Android恶意应用软件的检测与分析中。
-
公开(公告)号:CN116055175A
公开(公告)日:2023-05-02
申请号:CN202310040830.6
申请日:2023-01-12
Applicant: 燕山大学
IPC: H04L9/40 , G06N3/0442 , G06N3/045 , G06N3/0464 , G06N3/08 , G06N3/006 , G06F18/211 , G06N7/01
Abstract: 本发明公开了一种基于联合对称不确定性和超参数优化神经网络的入侵检测方法,属于网络安全、入侵检测技术领域,首先对于非数值特征进行独热编码,转换为数值特征,并对数值做归一化处理;基于对称不确定性和松散条件下的马尔可夫毯,使用联合对称不确定性进行特征选择,获得最优特征子集,降低了原始数据的维度;基于CNN和LSTM构建CNN‑LSTM融合神经网络分类模型,并使用改进后的PSO算法对模型的超参数进行自动优化,提高算法的泛化能力。本发明具有更好的特征选择性能,同时也具有更好的入侵检测流量分类性能。从而在准确率、精确率、召回率等多维评价指标中表现出较好性能。
-
公开(公告)号:CN113901449A
公开(公告)日:2022-01-07
申请号:CN202111045622.2
申请日:2021-09-07
Applicant: 燕山大学
Abstract: 本发明公开了基于静态和动态执行的二阶SQL注入防御和检测方法,包括静态分析模块和动态执行模块,静态分析模块对SQL语句添加标识符;动态执行模块作用于web应用执行过程中,用于解析静态分析模块添加的标识符,识别出SQL语句中包含的攻击字符,并使用字符转义或字符截取的手段对其进行防御。本发明通过混合静态分析和基于代理的动态执行的方法,实现通用的对二阶SQL注入的检测防御,提高检测的准确性,误报率较低,保护web应用和其后台数据库的安全。
-
公开(公告)号:CN109933539A
公开(公告)日:2019-06-25
申请号:CN201910298450.6
申请日:2019-04-15
Applicant: 燕山大学
IPC: G06F11/36
Abstract: 本发明公开了一种基于主成分分析和组合采样的软件缺陷预测方法,包括如下步骤:步骤S1:对软件缺陷数据利用融合特征选择降维去噪;步骤S2:对降维后的数据执行SMOTE过采样和分层随机采样相结合进行采样,其中过采样是指通过增加少数类样本的数量,从而使得数据集中类样本达到相对平衡,分层随机采样通过划分类进行分层,在每层内采用无放回随机采样;步骤S3:对处理后的数据选取分类器并对分类器参数进行调优。本发明选择随机森林分类器,其随机选择特征子集的特性,从而进一步达到对树的随机化目的,避免了分类器过拟合问题的出现,最终提升了软件缺陷预测性能以及预测效率,为现实中预测有缺陷软件提供了良好的理论和实验依据。
-
-
-
-
-
-
-
-
-