-
公开(公告)号:CN116910760A
公开(公告)日:2023-10-20
申请号:CN202310615838.0
申请日:2023-05-29
Applicant: 南通大学
Abstract: 本发明提供了一种使用CodeT5模型和提示微调的源代码漏洞检测方法,属于计算机技术领域,解决了传统的漏洞检测模型中检测准确率不高的技术问题。包括以下步骤:S1:从中收集开源项目的C和C++源代码,构成数据集;S2:对数据集进行预处理;S3:对构建的数据集随机划分成训练集、验证集和测试集;S4:使用hard soft方式创建为漏洞检测任务定制的提示模板;S5:创建为漏洞检测任务定制的Verbalizer;S6:训练集训练分类器;S7:对测试集进行最终结果预测。本发明的有益效果为:使用基于提示微调的预训练模型CodeT5进行漏洞检测,从而提高漏洞检测的性能。
-
公开(公告)号:CN111400652B
公开(公告)日:2023-06-13
申请号:CN202010134409.8
申请日:2020-03-02
Applicant: 南通大学
Abstract: 本发明提供了一种非负矩阵社区发现方法及电影社区发现方法,包括如下步骤S11数据收集与计算,形成相似度矩阵X和L;S12将X进行非负矩阵分解,X≈UV;S13构造含有L的目标函数O;以及S14基于目标函数,得到非负矩阵分解的迭代公式,进行迭代,完成社区划分。本发明的一种非负矩阵社区发现方法及电影社区发现方法,将双属性的非负矩阵分解应用于社区发现,提高了社区分解模块的精确性。
-
公开(公告)号:CN115185731A
公开(公告)日:2022-10-14
申请号:CN202210849549.2
申请日:2022-07-19
Applicant: 南通大学
Abstract: 本发明提供了一种混合多个深度学习模型以促进阻塞Bug预测的方法,属于计算机应用技术领域,解决了自动化预测多对Bug之间存在阻塞关系的技术问题。其技术方案为:包括以下步骤:(1)从Bug报告中提取“Summary”和“Description”两个字段构成数据集;(2)将自然语言文本进行词干恢复;(3)将这两个字段进行编码转换为词向量形式;(4)构建预测模型;(5)将两个分类器给出的值的加权和相加,得到最终的预测模型。本发明的有益效果为:本发明构建两个深度学习模型,并通过集成学习的方法Boosting将其结合起来,从而得到一个更全面、更稳健的预测模型,实现对阻塞Bug更好的预测。
-
公开(公告)号:CN113744072A
公开(公告)日:2021-12-03
申请号:CN202110987729.2
申请日:2021-08-26
Applicant: 南通大学
Abstract: 本发明公开了一种基于深度神经网络融合拓扑和内容社团检测方法,属于复杂网络分析技术领域,该方法挖掘带有内容信息的网络数据集中社团结构,运用模块度最大化和标准化切割分别建模拓扑和内容,基于谱矩阵特征值分解、矩阵低秩拟合和自动编码器重构在理论上的相似,无缝融合拓扑和内容,以构建基于自动编码器框架深度神经网络的社团检测模型;最后使用评价算法归一化互信息熵、杰卡德系数评估模型有效性。本发明的有益效果为:利用自动编码器框架无缝融合拓扑和内容,另一方面基于深度神经网络获取的网络表征具有良好的社团检测能力。
-
公开(公告)号:CN119473849A
公开(公告)日:2025-02-18
申请号:CN202411489722.8
申请日:2024-10-24
Applicant: 南通大学
IPC: G06F11/3604 , G06F18/22 , G06F18/25 , G06F18/214 , G06F40/30 , G06N20/20
Abstract: 本发明提供了一种基于对比学习和特征融合的及时缺陷预测方法,属于计算机技术领域,解决了预训练模型不能充分区分相似代码和捕捉内容上下文的技术问题。其技术方案为:包括以下步骤:S1:对数据集进行预处理和切分;S2:利用CodeBERT提取代码的语义特征;S3:将对比学习应用到语义特征提取中;S4:计算正样本和负样本的对比损失值,得到总的对比损失;S5:在特征融合阶段,将语义特征和专家特征融合,并调整模型全连接层和激活函数来优化模型架构。S6:使用训练好的模型在测试集上进行及时缺陷预测。本发明的有益效果为:提高及时缺陷预测的准确性和可靠性。
-
公开(公告)号:CN114936158B
公开(公告)日:2024-06-04
申请号:CN202210595157.8
申请日:2022-05-28
Applicant: 南通大学 , 江苏保润网络科技有限公司
IPC: G06F11/36 , G06F8/41 , G06F11/07 , G06N3/042 , G06N3/0464
Abstract: 本发明提供了一种基于图卷积神经网络的软件缺陷定位方法,包括以下步骤:(1)使用Louvain算法对抽象语法树进行剪枝,减少冗余节点;(2)结合抽象语法树与控制流图并通过Word2Vec生成对应的词向量,提取代码语义特征以及上下文依赖;(3)通过注意力机制进行关键特征提取和降维,减少模型参数的数量以及降低模型过拟合;(4)基于上述特征,对构建的图卷积神经网络模型进行训练,得到软件缺陷定位预测模型。本发明的有益效果为:结合抽象语法树和控制流图提取特征,通过图卷积神经网络进一步提取特征信息并进行节点分类,实现较高精度的缺陷定位,提高了缺陷定位的效率。
-
公开(公告)号:CN117972716A
公开(公告)日:2024-05-03
申请号:CN202410105910.X
申请日:2024-01-25
Applicant: 南通大学
Abstract: 本发明提供了一种通过强化学习增强基于提示学习的漏洞检测方法,属于智能软件工程技术领域。解决了现有深度学习模型在理解源代码的语义和语法能力的限制,以及微调预训练模型在大数据集上性能提升较低的技术问题。其技术方案为:包括两个部分:通过采用CodeBERT预训练模型从源代码中提取语义和语法信息,结合提示学习的方法,将预训练模型的预先知识快速应用到漏洞检测任务上,同时结合奖励机制,提升模型在大数据样本下的性能。本发明的有益效果为:可以提高软件漏洞检测的有效性。
-
公开(公告)号:CN117555776A
公开(公告)日:2024-02-13
申请号:CN202311463591.1
申请日:2023-11-06
Applicant: 南通大学
IPC: G06F11/36 , G06F18/241 , G06F18/214
Abstract: 本发明提供了一种基于对偶学习与深度语义挖掘的软件缺陷预测方法,属于智能软件工程技术领域。解决了当前利用词袋模型将源码转换为向量后的语义局限以及二次利用预测后的分类标签扩充原有数据集的技术问题。其技术方案为:包括两个部分:分别采用了CodeT5语言预训练模型从源代码中提取语义和结构信息,结合Bi‑GRU模型与自注意力机制,捕捉源代码中的上下文信息,学习源项目与目标项目的共同特性,来训练可靠的缺陷预测模型;还利用快速梯度法对数据集进行扰动扩充,同时对预测后的分类标签,通过对偶学习的反向分类器与正向分类器进行取反,进行二次预测。本发明的有益效果为:可以提高软件缺陷预测的有效性。
-
公开(公告)号:CN115617692A
公开(公告)日:2023-01-17
申请号:CN202211418719.8
申请日:2022-11-14
Applicant: 南通大学
IPC: G06F11/36 , G06F18/2415 , G06N3/045 , G06N3/048
Abstract: 本发明提供了一种基于GAT和GraphSMOTE的缺陷预测方法,属于计算机领域,解决了以往缺陷预测专注于代码语义信息而忽略代码结构信息,并且对代码的类不平衡没有关注的问题;其技术方案为:包括以下步骤:(1)对该数据集进行预处理操作;(2)利用先序遍历对AST的token进行提取,并且提取token之间的关系矩阵;(3)通过Bert对token编码为特征向量;(4)采用GraphSMOTE对向量进行类不平衡处理;(5)将向量输入图注意力神经网络训练,得到每个节点的特征表示;(6)将节点的向量表示输入到mlp分类器中,进行缺陷预测。本发明的有益效果为:提高了缺陷预测可靠性和准确性。
-
公开(公告)号:CN115471005A
公开(公告)日:2022-12-13
申请号:CN202211205164.9
申请日:2022-09-29
Applicant: 南通大学
Abstract: 本发明提供一种基于LS‑SVM‑Leslie组合模型的人口预测方法,属于数学和计算机科学。解决了传统人口预测模型中缺乏性别比例、年龄结构和人口数据变动规律的问题。其技术方案为:包括以下步骤:S1:收集数据并预处理;S2:选取预测指标并估计出生性别比;S3:用LS‑SVM模型预测特定年龄的生育率D1和男/女死亡率D2;S4:将D1、D2输入Leslie模型,输出特定初始年龄数据D3;S5:将D3作为Leslie下一年的输入参数,迭代输出每年的人口数据;S6:建立时间序列预测模型和灰色系统预测模型;S7:基于权重组合步骤S6中的两个模型并输出预测结果。本发明的有益效果为:本发明选取多个预测指标和预测模型,从而提高人口预测的可靠性。
-
-
-
-
-
-
-
-
-