一种基于增强嵌入向量语义表示的软件缺陷定位方法

    公开(公告)号:CN116302953A

    公开(公告)日:2023-06-23

    申请号:CN202310034262.9

    申请日:2023-01-10

    Applicant: 南通大学

    Abstract: 本发明提供了一种基于增强嵌入向量语义表示的软件缺陷定位方法,属于计算机技术领域,解决了多模态嵌入向量语义信息表示不足的技术问题。其技术方案为:包括以下步骤:S1:对源代码进行数据增强;S2:构造模态之间和模态内部的正负样本对;S3:对缺陷报告进行文本预处理,得到文本序列;S4:文本序列输入CodeBert预训练模型得到嵌入向量表示;S5:学习模态内部和模态之间的相似性;S6:联合检索任务和二元分类任务微调预训练模型。S7:对源代码文件进行排序得到预测结果。本发明的有益效果为:通过对比学习,获得更好的嵌入向量表示,联合检索模型和分类模型对源代码文件进行排序,进一步提高缺陷定位的有效性。

    一种基于CNN模型和领域特征的软件缺陷定位方法

    公开(公告)号:CN115617689A

    公开(公告)日:2023-01-17

    申请号:CN202211357801.4

    申请日:2022-11-01

    Applicant: 南通大学

    Abstract: 本发明提出了一种基于CNN模型和领域特征的软件缺陷定位方法,属于计算机技术领域。解决了缺陷定位方法不能充分使用代码结构和语义特征的问题。其技术方案为:包括以下步骤:S1、对数据集进行预处理;S2、通过Word2Vec生成词向量;S3、使用CNN网络分别提取词汇特征和代码结构特征,并通过MLP网络进行特征融合;S4、利用rVSM提取文本相似性;S5、从bug修复历史中提取4种类型的特征;S6、构造数据集,按比例划分训练集和测试集;S7、将步骤S2、步骤S3、步骤S4提取出的6种特征输入MLP网络;S8:通过softmax函数得到二分类结果。本发明的有益效果为:本发明采用学习统一的词汇语义和代码结构特征,同时融合文本相似性特征和缺陷修复历史从而提高缺陷定位的质量和可靠性。

Patent Agency Ranking