一种融合遗传算法和深度神经网络的软件缺陷预测方法

    公开(公告)号:CN115185732B

    公开(公告)日:2025-05-02

    申请号:CN202210849578.9

    申请日:2022-07-19

    Applicant: 南通大学

    Abstract: 本发明提供了一种融合遗传算法和深度神经网络的软件缺陷预测方法,属于计算机技术领域,解决了自动缺陷预测中新的特征具有不确定性,会和预测结果有别的技术问题;其技术方案为:采用了结果优化的遗传算法选取数据集的特征,结合变分自编码器和最大均值差异距离,学习源项目和目标项目的共性特征,来训练可靠的缺陷预测模型。本发明的有益效果为:本发明的遗传算法结合贝叶斯算法替换传统遗传算法的随机变异过程,设计了新的适应度函数,减少了不必要的特征,通过多组数据集上与传统跨项目缺陷预测方法对比,表明本发明可以提高软件预测的有效性。

    一种基于语义信息增强的Bash代码注释生成方法

    公开(公告)号:CN115794218A

    公开(公告)日:2023-03-14

    申请号:CN202211585727.1

    申请日:2022-12-09

    Applicant: 南通大学

    Abstract: 本发明提供了一种基于语义信息增强的Bash代码注释生成方法,属于计算机领域。解决了Bash注释生成任务中数据集较小和不能全部利用CodeBERT输出的所有特征信息的问题。其技术方案为:包括以下步骤:S1:在语料库生成的嵌入层使用对抗训练,生成对抗样本以增强语义信息;S2:使用原语料库生成的词嵌入和对抗样本对CodeBERT进行微调,输出12层表征信息;S3:使用Bi‑LSTM+注意力机制聚合12层表征信息,生成融合信息;S4:使用解码器进行解码并输出Bash注释。本发明的有益效果为:本发明提出的模型可以捕获和利用更多的语义表征信息,从而提高注释生成的质量和可靠性。

    一种通过强化学习增强基于提示学习的漏洞检测方法

    公开(公告)号:CN117972716A

    公开(公告)日:2024-05-03

    申请号:CN202410105910.X

    申请日:2024-01-25

    Applicant: 南通大学

    Abstract: 本发明提供了一种通过强化学习增强基于提示学习的漏洞检测方法,属于智能软件工程技术领域。解决了现有深度学习模型在理解源代码的语义和语法能力的限制,以及微调预训练模型在大数据集上性能提升较低的技术问题。其技术方案为:包括两个部分:通过采用CodeBERT预训练模型从源代码中提取语义和语法信息,结合提示学习的方法,将预训练模型的预先知识快速应用到漏洞检测任务上,同时结合奖励机制,提升模型在大数据样本下的性能。本发明的有益效果为:可以提高软件漏洞检测的有效性。

    一种基于GAT和GraphSMOTE的缺陷预测方法

    公开(公告)号:CN115617692A

    公开(公告)日:2023-01-17

    申请号:CN202211418719.8

    申请日:2022-11-14

    Applicant: 南通大学

    Abstract: 本发明提供了一种基于GAT和GraphSMOTE的缺陷预测方法,属于计算机领域,解决了以往缺陷预测专注于代码语义信息而忽略代码结构信息,并且对代码的类不平衡没有关注的问题;其技术方案为:包括以下步骤:(1)对该数据集进行预处理操作;(2)利用先序遍历对AST的token进行提取,并且提取token之间的关系矩阵;(3)通过Bert对token编码为特征向量;(4)采用GraphSMOTE对向量进行类不平衡处理;(5)将向量输入图注意力神经网络训练,得到每个节点的特征表示;(6)将节点的向量表示输入到mlp分类器中,进行缺陷预测。本发明的有益效果为:提高了缺陷预测可靠性和准确性。

    一种基于数据增强和语义感知的Bash代码注释自动生成方法

    公开(公告)号:CN116257253A

    公开(公告)日:2023-06-13

    申请号:CN202310167403.4

    申请日:2023-02-27

    Applicant: 南通大学

    Abstract: 本发明提供了一种基于数据增强和语义感知的Bash代码注释自动生成方法,属于计算机领域。解决了Bash注释生成任务中低资源和不能有效利用BERT模型输出的所有特征信息的问题。其技术方案为:包括以下步骤:S1:在模型嵌入层使用NP‑GD,生成多组对抗例子;S2:利用原训练集和生成的对抗例子微调CodeBERT;S3:使用LSTM+Attention聚合步骤S2输出的多层表征信息;S4:使用Transformer解码器解码步骤S3输出的融合向量并输出Bash注释。本发明的有益效果为:该方法可以捕获更多的表征信息,提高Bash注释生成的质量。

    基于GraphSAGE和LDA的软件缺陷预测方法

    公开(公告)号:CN116166563A

    公开(公告)日:2023-05-26

    申请号:CN202310211242.4

    申请日:2023-03-07

    Applicant: 南通大学

    Abstract: 本发明提供了一种基于GraphSAGE和LDA的缺陷预测方法,属于计算机技术领域,解决了手工特征方法没有考虑代码项目的自然语言信息软件缺陷预测的问题。其技术方案为:包括以下步骤:(1)搜集来自Github的缺陷实例数据集,对该数据集进行预处理操作;(2)使用LDA提取项目的主题描述信息;(3)将代码片段解析为抽象语法树,并且提取token之间的关系矩阵;(4)通过BERT对token和主题词信息编码为特征向量,并对向量进行拼接;(5)将向量输入GraphSAGE训练,得到每个节点的特征表示;(6)将节点表示输入到mlp分类器中,进行缺陷预测。本发明的有益效果为:提高缺陷预测的可靠性和准确性。

    一种基于预训练模型和空间结构信息的代码注释生成方法

    公开(公告)号:CN115469925A

    公开(公告)日:2022-12-13

    申请号:CN202211198773.6

    申请日:2022-09-29

    Applicant: 南通大学

    Abstract: 本发明提供了一种基于预训练模型和空间结构信息的代码注释生成方法,属于计算机领域。解决了注释生成模型中代码特征提取部分缺乏代码空间结构的问题。其技术方案为:包括以下步骤:S1:抽取Java部分并进行预处理;S2:使用CodeBERT提取代码语义特征,并进行关键特征提取和降维;S3:构建数据集的抽象语法树(ASTs);S4:构建GNN神经网络;S5:将步骤S2中提取的语义特征向量和步骤S3得到的ASTs信息输入GNN模型;S6:将步骤S2得到的语义特征信息和步骤S5得到的结构特征信息结合;S7:使用解码器进行解码并输出注释。本发明的有益效果为:本发明提高注释生成的质量和可靠性。

    一种基于CodeBert和空间结构的代码缺陷预测方法

    公开(公告)号:CN115185730A

    公开(公告)日:2022-10-14

    申请号:CN202210849413.1

    申请日:2022-07-19

    Applicant: 南通大学

    Abstract: 本发明提供了一种基于CodeBert和空间结构的代码缺陷预测方法,属于计算机技术领域。解决了缺陷预测模型中代码特征提取部分缺乏代码空间结构,使得模型获得更多的代码特征信息的问题。其技术方案为:包括以下步骤:S1:从issues中收集数据集并进行预处理操作;S2:进行关键特征提取和降维;S3:通过最短路径长度表示代码空间结构信息;S4:构建bi‑LSTM/LSTM神经网络模型;S5:构建Aast输入神经网络模型;S6:得到预测结果。本发明的有益效果为:本发明从源代码中提取更加丰富的代码语义及结构特征,从而提高缺陷预测的质量和可靠性。

    一种基于深层语义和数据增强的软件漏洞检测方法

    公开(公告)号:CN116467718A

    公开(公告)日:2023-07-21

    申请号:CN202310390442.0

    申请日:2023-04-13

    Applicant: 南通大学

    Abstract: 本发明提供了一种基于深层语义和数据增强的软件漏洞检测方法,属于计算机技术领域。解决了软件质量得不到保障的技术问题。其技术方案为:包括以下步骤:(1)搜集来自NIST的Java漏洞代码函数,对该漏洞代码集合进行预处理操作;(2)通过构建AST提取代码的结构化特征;(3)使用CodeBERT提取代码语义特征,并通过BERT‑Whitening进行关键特征提取和降维;(4)构建DR‑GD模型生成对抗样本,拓展原有的训练数据;(5)构建残差网络改进的图神经网络模型,学习代码的深层义以表示,用于软件漏洞检测。本发明的有益效果为:可以生成多样的对抗实例,提高软件漏洞检测的准确性和可靠性。

    一种融合遗传算法和深度神经网络的软件缺陷预测方法

    公开(公告)号:CN115185732A

    公开(公告)日:2022-10-14

    申请号:CN202210849578.9

    申请日:2022-07-19

    Applicant: 南通大学

    Abstract: 本发明提供了一种融合遗传算法和深度神经网络的软件缺陷预测方法,属于计算机技术领域,解决了自动缺陷预测中新的特征具有不确定性,会和预测结果有别的技术问题;其技术方案为:采用了结果优化的遗传算法选取数据集的特征,结合变分自编码器和最大均值差异距离,学习源项目和目标项目的共性特征,来训练可靠的缺陷预测模型。本发明的有益效果为:本发明的遗传算法结合贝叶斯算法替换传统遗传算法的随机变异过程,设计了新的适应度函数,减少了不必要的特征,通过多组数据集上与传统跨项目缺陷预测方法对比,表明本发明可以提高软件预测的有效性。

Patent Agency Ranking