一种面向预训练代码模型的防御方法及系统

    公开(公告)号:CN117763540A

    公开(公告)日:2024-03-26

    申请号:CN202311487322.9

    申请日:2023-11-09

    Applicant: 扬州大学

    Abstract: 本发明公开了一种面向预训练代码模型的防御方法及系统。该防御方法包括以下步骤:S1、获取并预处理代码数据集,生成对抗代码样本。S2、对对抗代码样本进行数据增强,得到训练集。S3、获取预训练模型,所述预训练模型包括掩码语言模型,基于所述训练集和预训练模型生成异常检测模型。S4、获取待检测代码文件,基于异常检测模型对待检测代码文件进行检测,识别出具有对抗性的代码文件的异常变量名。S5、基于掩码语言模型将所述异常变量名替换并修复,输出防御修复代码文件。防御系统包括数据获取模块、数据增强模块、异常检测模型生成模块、异常变量名提取模块、代码文件替换修复模块。本发明具有考虑静态分析、准确性高、速度快的特点。

Patent Agency Ranking