-
公开(公告)号:CN117763540A
公开(公告)日:2024-03-26
申请号:CN202311487322.9
申请日:2023-11-09
Applicant: 扬州大学
Abstract: 本发明公开了一种面向预训练代码模型的防御方法及系统。该防御方法包括以下步骤:S1、获取并预处理代码数据集,生成对抗代码样本。S2、对对抗代码样本进行数据增强,得到训练集。S3、获取预训练模型,所述预训练模型包括掩码语言模型,基于所述训练集和预训练模型生成异常检测模型。S4、获取待检测代码文件,基于异常检测模型对待检测代码文件进行检测,识别出具有对抗性的代码文件的异常变量名。S5、基于掩码语言模型将所述异常变量名替换并修复,输出防御修复代码文件。防御系统包括数据获取模块、数据增强模块、异常检测模型生成模块、异常变量名提取模块、代码文件替换修复模块。本发明具有考虑静态分析、准确性高、速度快的特点。
-
公开(公告)号:CN118312957A
公开(公告)日:2024-07-09
申请号:CN202410505753.1
申请日:2024-04-25
Applicant: 扬州大学
IPC: G06F21/56 , G06F18/2431 , G06F18/214
Abstract: 本发明公开了一种面向代码模型中分类任务的后门攻击方法及系统。后门攻击方法包括:S1、收集并预处理干净样本,得到重要性变量名;S2、在干净样本中,按照标签类别对变量名分类,得到多个触发集;同时从干净样本中选取目标标签;S3、将目标标签对应的触发集中的变量名进行C分数计算;在干净样本中,将C分数最大的变量名替换重要性变量名,预测替换后的标签,重复上述过程直至标签变化为目标标签,此时替换后的干净样本为中毒样本,将中毒样本中替换产生的变量名作为触发器;S4、将中毒样本中的触发器随机插入干净样本,形成负样本;采用基于负样本、中毒样本、干净样本得到的攻击模型进行攻击。本发明具有简单、隐蔽性强、误触率低的特点。
-