-
公开(公告)号:CN116483337A
公开(公告)日:2023-07-25
申请号:CN202310445624.3
申请日:2023-04-24
Applicant: 南通大学
IPC: G06F8/33 , G06F16/33 , G06N3/0455 , G06N3/0499 , G06N3/047 , G06N3/048 , G06N3/094
Abstract: 本发明提供了一种基于提示学习和数据增强的API补全方法,属于计算机领域。解决了基于生成技术的API推荐模型预测能力有限和用于API推荐的训练数据不足的问题。其技术方案为:包括以下步骤:S1:语料库预处理并构造提示前缀;S2:构建预训练模型CodeT5和ATCom对抗训练方法;S3:在模型嵌入层使用ATCom,生成多组对抗样本;S4:利用原语料库和生成的对抗样本微调CodeT5并生成完整的API。本发明的有益效果为:根据不完整的API前缀和提示信息进行API补全,提高开发人员的效率和编程体验,通过对抗样本的训练,增强模型的鲁棒性,提高模型的泛化能力,从而提高API补全的准确性和稳定性。
-
公开(公告)号:CN115185732A
公开(公告)日:2022-10-14
申请号:CN202210849578.9
申请日:2022-07-19
Applicant: 南通大学
Abstract: 本发明提供了一种融合遗传算法和深度神经网络的软件缺陷预测方法,属于计算机技术领域,解决了自动缺陷预测中新的特征具有不确定性,会和预测结果有别的技术问题;其技术方案为:采用了结果优化的遗传算法选取数据集的特征,结合变分自编码器和最大均值差异距离,学习源项目和目标项目的共性特征,来训练可靠的缺陷预测模型。本发明的有益效果为:本发明的遗传算法结合贝叶斯算法替换传统遗传算法的随机变异过程,设计了新的适应度函数,减少了不必要的特征,通过多组数据集上与传统跨项目缺陷预测方法对比,表明本发明可以提高软件预测的有效性。
-
公开(公告)号:CN115471005A
公开(公告)日:2022-12-13
申请号:CN202211205164.9
申请日:2022-09-29
Applicant: 南通大学
Abstract: 本发明提供一种基于LS‑SVM‑Leslie组合模型的人口预测方法,属于数学和计算机科学。解决了传统人口预测模型中缺乏性别比例、年龄结构和人口数据变动规律的问题。其技术方案为:包括以下步骤:S1:收集数据并预处理;S2:选取预测指标并估计出生性别比;S3:用LS‑SVM模型预测特定年龄的生育率D1和男/女死亡率D2;S4:将D1、D2输入Leslie模型,输出特定初始年龄数据D3;S5:将D3作为Leslie下一年的输入参数,迭代输出每年的人口数据;S6:建立时间序列预测模型和灰色系统预测模型;S7:基于权重组合步骤S6中的两个模型并输出预测结果。本发明的有益效果为:本发明选取多个预测指标和预测模型,从而提高人口预测的可靠性。
-
公开(公告)号:CN115185732B
公开(公告)日:2025-05-02
申请号:CN202210849578.9
申请日:2022-07-19
Applicant: 南通大学
IPC: G06F11/07 , G06F8/75 , G06N3/0455 , G06N3/086 , G06N3/126
Abstract: 本发明提供了一种融合遗传算法和深度神经网络的软件缺陷预测方法,属于计算机技术领域,解决了自动缺陷预测中新的特征具有不确定性,会和预测结果有别的技术问题;其技术方案为:采用了结果优化的遗传算法选取数据集的特征,结合变分自编码器和最大均值差异距离,学习源项目和目标项目的共性特征,来训练可靠的缺陷预测模型。本发明的有益效果为:本发明的遗传算法结合贝叶斯算法替换传统遗传算法的随机变异过程,设计了新的适应度函数,减少了不必要的特征,通过多组数据集上与传统跨项目缺陷预测方法对比,表明本发明可以提高软件预测的有效性。
-
公开(公告)号:CN115794218A
公开(公告)日:2023-03-14
申请号:CN202211585727.1
申请日:2022-12-09
Applicant: 南通大学
IPC: G06F8/73 , G06F40/166 , G06N3/0442
Abstract: 本发明提供了一种基于语义信息增强的Bash代码注释生成方法,属于计算机领域。解决了Bash注释生成任务中数据集较小和不能全部利用CodeBERT输出的所有特征信息的问题。其技术方案为:包括以下步骤:S1:在语料库生成的嵌入层使用对抗训练,生成对抗样本以增强语义信息;S2:使用原语料库生成的词嵌入和对抗样本对CodeBERT进行微调,输出12层表征信息;S3:使用Bi‑LSTM+注意力机制聚合12层表征信息,生成融合信息;S4:使用解码器进行解码并输出Bash注释。本发明的有益效果为:本发明提出的模型可以捕获和利用更多的语义表征信息,从而提高注释生成的质量和可靠性。
-
公开(公告)号:CN115185731B
公开(公告)日:2025-05-02
申请号:CN202210849549.2
申请日:2022-07-19
Applicant: 南通大学
IPC: G06F11/07 , G06F8/75 , G06N3/045 , G06N3/0442 , G06N3/0464 , G06N3/08 , G06N20/20
Abstract: 本发明提供了一种混合多个深度学习模型以促进阻塞Bug预测的方法,属于计算机应用技术领域,解决了自动化预测多对Bug之间存在阻塞关系的技术问题。其技术方案为:包括以下步骤:(1)从Bug报告中提取“Summary”和“Description”两个字段构成数据集;(2)将自然语言文本进行词干恢复;(3)将这两个字段进行编码转换为词向量形式;(4)构建预测模型;(5)将两个分类器给出的值的加权和相加,得到最终的预测模型。本发明的有益效果为:本发明构建两个深度学习模型,并通过集成学习的方法Boosting将其结合起来,从而得到一个更全面、更稳健的预测模型,实现对阻塞Bug更好的预测。
-
公开(公告)号:CN115185731A
公开(公告)日:2022-10-14
申请号:CN202210849549.2
申请日:2022-07-19
Applicant: 南通大学
Abstract: 本发明提供了一种混合多个深度学习模型以促进阻塞Bug预测的方法,属于计算机应用技术领域,解决了自动化预测多对Bug之间存在阻塞关系的技术问题。其技术方案为:包括以下步骤:(1)从Bug报告中提取“Summary”和“Description”两个字段构成数据集;(2)将自然语言文本进行词干恢复;(3)将这两个字段进行编码转换为词向量形式;(4)构建预测模型;(5)将两个分类器给出的值的加权和相加,得到最终的预测模型。本发明的有益效果为:本发明构建两个深度学习模型,并通过集成学习的方法Boosting将其结合起来,从而得到一个更全面、更稳健的预测模型,实现对阻塞Bug更好的预测。
-
公开(公告)号:CN116257253A
公开(公告)日:2023-06-13
申请号:CN202310167403.4
申请日:2023-02-27
Applicant: 南通大学
IPC: G06F8/41 , G06N3/0442 , G06N3/08
Abstract: 本发明提供了一种基于数据增强和语义感知的Bash代码注释自动生成方法,属于计算机领域。解决了Bash注释生成任务中低资源和不能有效利用BERT模型输出的所有特征信息的问题。其技术方案为:包括以下步骤:S1:在模型嵌入层使用NP‑GD,生成多组对抗例子;S2:利用原训练集和生成的对抗例子微调CodeBERT;S3:使用LSTM+Attention聚合步骤S2输出的多层表征信息;S4:使用Transformer解码器解码步骤S3输出的融合向量并输出Bash注释。本发明的有益效果为:该方法可以捕获更多的表征信息,提高Bash注释生成的质量。
-
公开(公告)号:CN116166563A
公开(公告)日:2023-05-26
申请号:CN202310211242.4
申请日:2023-03-07
Applicant: 南通大学
Abstract: 本发明提供了一种基于GraphSAGE和LDA的缺陷预测方法,属于计算机技术领域,解决了手工特征方法没有考虑代码项目的自然语言信息软件缺陷预测的问题。其技术方案为:包括以下步骤:(1)搜集来自Github的缺陷实例数据集,对该数据集进行预处理操作;(2)使用LDA提取项目的主题描述信息;(3)将代码片段解析为抽象语法树,并且提取token之间的关系矩阵;(4)通过BERT对token和主题词信息编码为特征向量,并对向量进行拼接;(5)将向量输入GraphSAGE训练,得到每个节点的特征表示;(6)将节点表示输入到mlp分类器中,进行缺陷预测。本发明的有益效果为:提高缺陷预测的可靠性和准确性。
-
公开(公告)号:CN115469925A
公开(公告)日:2022-12-13
申请号:CN202211198773.6
申请日:2022-09-29
Applicant: 南通大学
Abstract: 本发明提供了一种基于预训练模型和空间结构信息的代码注释生成方法,属于计算机领域。解决了注释生成模型中代码特征提取部分缺乏代码空间结构的问题。其技术方案为:包括以下步骤:S1:抽取Java部分并进行预处理;S2:使用CodeBERT提取代码语义特征,并进行关键特征提取和降维;S3:构建数据集的抽象语法树(ASTs);S4:构建GNN神经网络;S5:将步骤S2中提取的语义特征向量和步骤S3得到的ASTs信息输入GNN模型;S6:将步骤S2得到的语义特征信息和步骤S5得到的结构特征信息结合;S7:使用解码器进行解码并输出注释。本发明的有益效果为:本发明提高注释生成的质量和可靠性。
-
-
-
-
-
-
-
-
-