-
公开(公告)号:CN116257253A
公开(公告)日:2023-06-13
申请号:CN202310167403.4
申请日:2023-02-27
Applicant: 南通大学
IPC: G06F8/41 , G06N3/0442 , G06N3/08
Abstract: 本发明提供了一种基于数据增强和语义感知的Bash代码注释自动生成方法,属于计算机领域。解决了Bash注释生成任务中低资源和不能有效利用BERT模型输出的所有特征信息的问题。其技术方案为:包括以下步骤:S1:在模型嵌入层使用NP‑GD,生成多组对抗例子;S2:利用原训练集和生成的对抗例子微调CodeBERT;S3:使用LSTM+Attention聚合步骤S2输出的多层表征信息;S4:使用Transformer解码器解码步骤S3输出的融合向量并输出Bash注释。本发明的有益效果为:该方法可以捕获更多的表征信息,提高Bash注释生成的质量。
-
公开(公告)号:CN116166563A
公开(公告)日:2023-05-26
申请号:CN202310211242.4
申请日:2023-03-07
Applicant: 南通大学
Abstract: 本发明提供了一种基于GraphSAGE和LDA的缺陷预测方法,属于计算机技术领域,解决了手工特征方法没有考虑代码项目的自然语言信息软件缺陷预测的问题。其技术方案为:包括以下步骤:(1)搜集来自Github的缺陷实例数据集,对该数据集进行预处理操作;(2)使用LDA提取项目的主题描述信息;(3)将代码片段解析为抽象语法树,并且提取token之间的关系矩阵;(4)通过BERT对token和主题词信息编码为特征向量,并对向量进行拼接;(5)将向量输入GraphSAGE训练,得到每个节点的特征表示;(6)将节点表示输入到mlp分类器中,进行缺陷预测。本发明的有益效果为:提高缺陷预测的可靠性和准确性。
-