-
公开(公告)号:CN120068085A
公开(公告)日:2025-05-30
申请号:CN202510070426.2
申请日:2025-01-16
Applicant: 大连海事大学
IPC: G06F21/57 , G06N3/045 , G06F18/214 , G06F18/213 , G06F18/2415
Abstract: 本发明提供了一种利用噪声转移进行代码漏洞修复检测的方法,包括如下步骤:S1、将现有的漏洞数据集以及从现实的开源项目中进行数据集收集进行合并,以构成总数据集;S2、用CodeBERT对总数据集的代码进行更改提取嵌入,通过特征提取器获得代码更改特征;S3、将代码更改特征输入到预训练模型中,计算代码更改特征的置信度;S4、获得不可信数据的转移概率;S5、根据获得的转移概率构建转移概率矩阵,将转移概率矩阵和不可信数据的输出结果进行运算,获得不可信数据的分类结果;S6、将可信数据输入到分类器中,获得可信数据的分类结果。通过合理使用本发明,模型能够更加精准地修正训练过程中的错误标签,从而提高整体表现。
-
公开(公告)号:CN120068083A
公开(公告)日:2025-05-30
申请号:CN202510070416.9
申请日:2025-01-16
Applicant: 大连海事大学
IPC: G06F21/57 , G06N3/045 , G06F18/214 , G06F18/213 , G06F40/253 , G06F18/22
Abstract: 本发明提供了一种利用图嵌入组件构成特征图结构进行代码漏洞修复检测的方法,包括如下步骤:S1、获取漏洞修复后的目标数据集;S2、利用图嵌入组件将文本特征编码表示为文本的语法和语法信息并捕获文本关键字的特征结构图;S3、获取目标数据集的非文本特征,将非文本特征视为单独的节点,将文本特征图和非文本特征节点聚合成一个文本和非文本聚合图,文本和非文本聚合图的每个节点上的的代码信息和相似度信息;S4、在权重赋能组件中,将代码信息和相似度信息进行相似度计算;S5、将权重赋能过后的代码的节点信息输入到分类器中,获得检测结果。本方法能够在更高层次上捕捉漏洞修复的核心特征,从而提升漏洞修复检测的准确性和效率。
-