一种基于代码结构知识微调的源代码漏洞检测方法

    公开(公告)号:CN118312438A

    公开(公告)日:2024-07-09

    申请号:CN202410569009.8

    申请日:2024-05-09

    Applicant: 南通大学

    Abstract: 本发明提供了一种基于代码结构知识微调的源代码漏洞检测方法,属于计算机技术领域,解决了深度神经网络模型在微调时不能充分的理解源代码的上下文和结构特征的技术问题。其技术方案为:包括以下步骤:S1:对数据集进行预处理和切分;S2:提取代码的抽象语法树;S3:将训练集中的代码片段输入到CodeT5模型中;S4:计算结构距离矩阵和注意力矩阵之间的sinkhorn距离,得到结构损失;S5:在微调阶段,使用多任务学习方法,联合结构损失和漏洞检测的目标函数来优化模型。S6:将测试集输入到已训练好的模型中进行二分类漏洞检测。本发明的有益效果为:提高源代码漏洞检测的准确性和可靠性。

    一种基于深层语义和数据增强的软件漏洞检测方法

    公开(公告)号:CN116467718A

    公开(公告)日:2023-07-21

    申请号:CN202310390442.0

    申请日:2023-04-13

    Applicant: 南通大学

    Abstract: 本发明提供了一种基于深层语义和数据增强的软件漏洞检测方法,属于计算机技术领域。解决了软件质量得不到保障的技术问题。其技术方案为:包括以下步骤:(1)搜集来自NIST的Java漏洞代码函数,对该漏洞代码集合进行预处理操作;(2)通过构建AST提取代码的结构化特征;(3)使用CodeBERT提取代码语义特征,并通过BERT‑Whitening进行关键特征提取和降维;(4)构建DR‑GD模型生成对抗样本,拓展原有的训练数据;(5)构建残差网络改进的图神经网络模型,学习代码的深层义以表示,用于软件漏洞检测。本发明的有益效果为:可以生成多样的对抗实例,提高软件漏洞检测的准确性和可靠性。

    一种融合多维度特征的自动定位安全补丁方法

    公开(公告)号:CN115729741A

    公开(公告)日:2023-03-03

    申请号:CN202211484631.6

    申请日:2022-11-24

    Applicant: 南通大学

    Abstract: 本发明提供了一种融合多维度特征的自动定位安全补丁方法的方法,其技术方案为:包括以下步骤:S1:通过挖掘GitHub、CVE和NVD库,从中收集漏洞和代码提交的数据集并进行预处理操作;S2:使用GumTree工具提取漏洞描述的专家特征取值;S3:使用T5预训练模型提取漏洞描述和提交信息的深层语义特征取值,并使用BERT‑whitening来进一步处理语义向量取值,通过线性变换进行关键特征提取和降维;S4:对构建的数据集随机划分成训练集、验证集和测试集;S5:使用决策树模型预测最终结果。本发明的有益效果为:从数据集中提取更加丰富的特征,从而提高安全补丁定位的质量和可靠性。

    一种基于语境学习的软件漏洞评估方法

    公开(公告)号:CN118296609A

    公开(公告)日:2024-07-05

    申请号:CN202410168322.0

    申请日:2024-02-06

    Applicant: 南通大学

    Abstract: 本发明提供了一种基于语境学习的软件漏洞评估方法,属于计算机技术领域,解决了评估漏洞数据稀缺和大语言模型对评估任务的局限性的技术问题。包括以下步骤:S1:搜集漏洞评估相关数据;S2:获取向量表示;S3:使用Joern工具生成代码属性图;S4:计算目标漏洞描述与数据集中漏洞描述的文本相似度;S5:计算目标漏洞代码与数据集中漏洞代码的代码相似度;S6:对上述相似度进行加权融合,得到最终的相似度,并排序找到最相似的漏洞代码与描述示例;S7:通过语境学习来执行漏洞代码的评估任务。本发明的有益效果为:通过对大语言模型进行语境学习,无需额外训练过程就进行高质量漏洞评估。

    基于代码词法和结构信息融合的半监督漏洞评估方法

    公开(公告)号:CN117556417A

    公开(公告)日:2024-02-13

    申请号:CN202311463590.7

    申请日:2023-11-06

    Applicant: 南通大学

    Abstract: 本发明提供了一种融合代码词法和结构信息的半监督软件漏洞评估方法,属于计算机技术领域;解决了软件漏洞评估领域标记数据量少和缺少代码结构信息的问题。其技术方案为:包括以下步骤:S1:搜集漏洞评估相关数据;S2:使用Joern工具生成代码属性图并提取代码结构信息;S3:将词法信息和结构信息融合;S4:随机选择少量漏洞代码;S5:构建出最优漏洞评估模型;S6:针对需要评估的漏洞代码,载入上述模型并完成评估。本发明的有益效果为:借助半监督学习方法,并将代码词法和结构信息进行融合,仅需专家标记少量数据,就可以完成高质量漏洞评估模型的训练。

    一种基于上下文学习和大语言模型的Solidity注释生成方法

    公开(公告)号:CN117492825A

    公开(公告)日:2024-02-02

    申请号:CN202311408261.2

    申请日:2023-10-27

    Applicant: 南通大学

    Abstract: 本发明提供了基于上下文学习和大语言模型的Solidity代码注释生成方法,属于软件工程技术领域。解决了主流方法不能生成新注释,依赖数据集和泛化能力不足的技术问题。其技术方案为:包括以下步骤:(1)通过智能合约代码社区搜集语料库;(2)检索出最相似的前n个代码片段。(3)为支持大语言模型的上下文学习,结合检索到的示范与定制的提示词构造提示模板。(4)调用大语言模型API,结合提示模板完成注释生成。本发明的有益效果:本发明无需额外训练,可显著提高自动生成的代码注释质量。

    一种基于迁移学习和特征融合的跨项目漏洞检测方法

    公开(公告)号:CN119128889A

    公开(公告)日:2024-12-13

    申请号:CN202311592849.8

    申请日:2023-11-27

    Applicant: 南通大学

    Abstract: 本发明提供了一种基于迁移学习和特征融合的跨项目漏洞检测方法,属于计算机技术领域。解决了跨项目漏洞检测模型中特征提取部分缺乏专家特征的问题,并更好地利用已标记的源项目数据来进行模型的训练。其技术方案为:包括以下步骤:S1:构成数据集;S2:使用Understand工具提取专家特征;S3:使用过采样方法SMOTE处理训练数据类不平衡问题;S4:分别构建基于专家特征和语义特征的模型;S5:通过加权平均方法对两个模型进行融合;S6:使用融合后的模型来检测目标项目内新的代码是否含有漏洞。本发明的有益效果为:融合专家特征和语义特征,并仅需标记目标项目内的少量数据就可提高跨项目漏洞检测的准确度。

    一种基于漏洞原因描述和指令微调的软件漏洞检测方法

    公开(公告)号:CN118364470A

    公开(公告)日:2024-07-19

    申请号:CN202410481701.5

    申请日:2024-04-22

    Applicant: 南通大学

    Abstract: 本发明提供了一种基于漏洞原因描述和指令微调的软件漏洞检测方法,属于计算机技术领域,解决了常见软件漏洞检测方法在分析漏洞时往往缺乏对漏洞原因的深入理解,导致检测准确性不高的技术问题。其技术方案为:包括以下步骤:S1:将漏洞数据集分为训练集和测试集;S2:利用所得原因分析构建指令微调数据集;S3:获得微调后的模型;S4:执行二分类漏洞检测。本发明的有益效果为:本发明提供了一种结合漏洞原因描述和指令微调的漏洞检测方法,可有效提高漏洞检测的准确性和效率;加入漏洞原因描述,有助于模型在微调时深入理解漏洞的产生原因,且使得模型更加适应漏洞检测任务和代码结构,提高了漏洞检测的精度和泛化能力。

    一种改进的基于大语言模型的漏洞检测方法

    公开(公告)号:CN117494131A

    公开(公告)日:2024-02-02

    申请号:CN202311408265.0

    申请日:2023-10-27

    Applicant: 南通大学

    Abstract: 本发明提供了一种改进的基于大语言模型的漏洞检测方法,属于计算机技术领域,解决了传统漏洞检测方法的准确率和效率低下的技术问题。其技术方案为:包括以下步骤:S1:构成漏洞数据集;S2:将数据集划分成训练集、验证集和测试集;S3:使用CodeT5模型提取语义特征;S4:通过计算语义相似度得到数据集中与目标代码最相似的TOP k个候选代码;S5:融合候选代码和目标代码的词法相似性和语法相似性得到一个混合分数;S7:加入身份信息提示和领域信息提示;S8:将提示、目标代码、图结构数据和最相似的示范提供给大语言模型。本发明的有益效果为:能够更准确地识别潜在的漏洞,并提高模型的鲁棒性和适应性。

Patent Agency Ranking