-
公开(公告)号:CN115185730A
公开(公告)日:2022-10-14
申请号:CN202210849413.1
申请日:2022-07-19
Applicant: 南通大学
Abstract: 本发明提供了一种基于CodeBert和空间结构的代码缺陷预测方法,属于计算机技术领域。解决了缺陷预测模型中代码特征提取部分缺乏代码空间结构,使得模型获得更多的代码特征信息的问题。其技术方案为:包括以下步骤:S1:从issues中收集数据集并进行预处理操作;S2:进行关键特征提取和降维;S3:通过最短路径长度表示代码空间结构信息;S4:构建bi‑LSTM/LSTM神经网络模型;S5:构建Aast输入神经网络模型;S6:得到预测结果。本发明的有益效果为:本发明从源代码中提取更加丰富的代码语义及结构特征,从而提高缺陷预测的质量和可靠性。
-
公开(公告)号:CN114936158A
公开(公告)日:2022-08-23
申请号:CN202210595157.8
申请日:2022-05-28
Applicant: 南通大学 , 江苏保润网络科技有限公司
Abstract: 本发明提供了一种基于图卷积神经网络的软件缺陷定位方法,包括以下步骤:(1)使用Louvain算法对抽象语法树进行剪枝,减少冗余节点;(2)结合抽象语法树与控制流图并通过Word2Vec生成对应的词向量,提取代码语义特征以及上下文依赖;(3)通过注意力机制进行关键特征提取和降维,减少模型参数的数量以及降低模型过拟合;(4)基于上述特征,对构建的图卷积神经网络模型进行训练,得到软件缺陷定位预测模型。本发明的有益效果为:结合抽象语法树和控制流图提取特征,通过图卷积神经网络进一步提取特征信息并进行节点分类,实现较高精度的缺陷定位,提高了缺陷定位的效率。
-
公开(公告)号:CN114896163A
公开(公告)日:2022-08-12
申请号:CN202210595165.2
申请日:2022-05-28
Applicant: 南通大学 , 江苏边智科技有限公司
Abstract: 本发明属于计算机应用技术领域,公开了一种基于GraphSAGE和MLP的软件缺陷定位方法。该方法包括以下步骤:1)获取待测程序的代码覆盖信息,统计语句被失败测试用例覆盖的次数;2)构建抽象语法树并进行剪枝处理,以及对每个节点进行词嵌入;3)将语义信息与覆盖次数作为节点属性;4)通过GraphSAGE学习有价值的特征,得到每个节点的节点表示;5)对于一个语句由多个节点组成的情况,对其进行特征融合;6)将每个语句的表示输入到多层感知机中进行训练并排序,生成错误报告。本发明结合静态和动态特征,通过图神经网络进一步提取特征信息,并利用多层感知机来计算可疑度,实现较高精度的缺陷定位。
-
-
公开(公告)号:CN111400652A
公开(公告)日:2020-07-10
申请号:CN202010134409.8
申请日:2020-03-02
Applicant: 南通大学
Abstract: 本发明提供了一种非负矩阵社区发现方法及电影社区发现方法,包括如下步骤S11数据收集与计算,形成相似度矩阵X和L;S12将X进行非负矩阵分解,X≈UV;S13构造含有L的目标函数O;以及S14基于目标函数,得到非负矩阵分解的迭代公式,进行迭代,完成社区划分。本发明的一种非负矩阵社区发现方法及电影社区发现方法,将双属性的非负矩阵分解应用于社区发现,提高了社区分解模块的精确性。
-
公开(公告)号:CN119760728A
公开(公告)日:2025-04-04
申请号:CN202411922007.9
申请日:2024-12-25
Applicant: 南通大学
IPC: G06F21/57 , G06F18/22 , G06F18/214 , G06F8/73 , G06N3/0455 , G06N3/0895
Abstract: 本发明提供了一种基于多模态对比学习和低秩适应的源代码漏洞检测方法,属于计算机技术领域,解决了传统漏洞检测方法中无法充分利用多模态信息并面临计算效率瓶颈的技术问题。其技术方案为:包括以下步骤:S1:对数据集进行预处理和切分;S2:通过预训练模型GraphCodeBERT提取每个模态的初步表示;S3:对每个模态的表示应用低秩适应进行微调;S4:使用对比学习对不同模态的表示进行对齐;S5:在训练过程中,通过优化模型的多模态表示;S6:将测试集输入到已训练好的模型中进行漏洞检测,输出代码是否存在漏洞的分类结果。本发明的有益效果为:提高了模型对代码漏洞的识别能力,降低了计算成本。
-
公开(公告)号:CN119760720A
公开(公告)日:2025-04-04
申请号:CN202411870775.4
申请日:2024-12-18
Applicant: 南通大学
IPC: G06F21/57 , G06F8/75 , G06F18/2415 , G06F18/10 , G06N3/042 , G06N3/045 , G06N3/047 , G06N3/048 , G06N3/08 , G06N5/01
Abstract: 本发明提供了一种基于异构图注意力网络的源代码漏洞检测方法,属于智能软件工程领域。解决了深度学习模型在特征提取过程中语义信息不足的技术问题。其技术方案为:包括以下步骤:S1:对开源数据集进行数据预处理;S2:通过代码解析器将源代码解析为图结构;S3:融合多种代码结构图,并对图结构进行剪枝操作;S4:利用Word2Vec对异构图节点进行特征初始化;S5:基于元路径将异构图划分为12个元图;S6:将异构图信息输入两层注意力网络进行模型训练;S7:基于验证集筛选出最佳模型。本发明的有益效果在于:通过将源代码解析为异构图结构,并结合两层注意力网络进行模型训练,有效提升了漏洞检测的性能。
-
公开(公告)号:CN119646822A
公开(公告)日:2025-03-18
申请号:CN202411714608.0
申请日:2024-11-27
Applicant: 南通大学
IPC: G06F21/57 , G06F18/213 , G06F18/24 , G06N3/084
Abstract: 本发明提供了一种基于长尾增量学习的软件漏洞类型识别方法,属于软件工程技术领域。解决了现有方法在应对动态数据流时,面临灾难性遗忘和长尾问题而导致漏洞类型识别精度下降的技术问题。其技术方案为:包括以下步骤:(1)搜集漏洞类型识别数据集,并按照漏洞发布的时间进行任务划分;(2)使用混合回放来从旧任务数据中选出典型漏洞样本;(3)设计混合提示模板及映射方法,融合源代码和漏洞描述,输入到CodeT5进行模型和提示模板训练;(4)引入EWC正则化项;(5)借助混合提示模板融合漏洞代码和描述来预测漏洞类型。本发明的有益效果为:缓解灾难性遗忘和长尾问题。
-
公开(公告)号:CN117608998A
公开(公告)日:2024-02-27
申请号:CN202211723126.2
申请日:2022-12-30
Applicant: 南通大学
IPC: G06F11/36
Abstract: 本发明提供了一种融合多维度特征的多目标代码提交缺陷倾向性预测方法,属于计算机技术领域。解决了多目标缺陷预测模型中特征提取部分缺乏语义特征的问题,使得模型获得更多的代码特征信息。其技术方案为:包括以下步骤:S1:抽取代码提交变更信息和提交日志消息;S2:使用CodeBert提取语义特征,并使用CommitGuru提取专家特征;S3:构建基于多目标优化的帕累托最优解集;S4:基于验证集,从帕累托最优解集中选出最优模型;S5:使用最优模型来预测一个新的代码提交是否引入缺陷。本发明的有益效果为:将专家特征和语义特征进行融合,从而提高缺陷预测的质量和可靠性。
-
公开(公告)号:CN116467718A
公开(公告)日:2023-07-21
申请号:CN202310390442.0
申请日:2023-04-13
Applicant: 南通大学
IPC: G06F21/57 , G06N3/0464 , G06N3/08 , G06F18/24 , G06F18/214 , G06F8/41
Abstract: 本发明提供了一种基于深层语义和数据增强的软件漏洞检测方法,属于计算机技术领域。解决了软件质量得不到保障的技术问题。其技术方案为:包括以下步骤:(1)搜集来自NIST的Java漏洞代码函数,对该漏洞代码集合进行预处理操作;(2)通过构建AST提取代码的结构化特征;(3)使用CodeBERT提取代码语义特征,并通过BERT‑Whitening进行关键特征提取和降维;(4)构建DR‑GD模型生成对抗样本,拓展原有的训练数据;(5)构建残差网络改进的图神经网络模型,学习代码的深层义以表示,用于软件漏洞检测。本发明的有益效果为:可以生成多样的对抗实例,提高软件漏洞检测的准确性和可靠性。
-
-
-
-
-
-
-
-
-