-
公开(公告)号:CN117952187A
公开(公告)日:2024-04-30
申请号:CN202311830786.5
申请日:2023-12-28
Applicant: 北京理工大学 , 中科信息安全共性技术国家工程研究中心有限公司
IPC: G06N3/094 , G06N3/084 , G06N3/0475 , G06V10/764 , G06V10/82
Abstract: 一种破坏通道混合和令牌混合机制的对抗样本生成方法通过使用MA遮蔽Mixer层的部分输入,实现类似于Dropout的效果,防止生成的对抗样本对MLP‑Mixer过拟合,提高对抗样本攻击目标模型的欺骗率,解决了现有技术在白盒MLP‑Mixer模型上生成的对抗样本转移性效果差,攻击未知结构黑盒模型成功率低等不足。
-
公开(公告)号:CN118246063A
公开(公告)日:2024-06-25
申请号:CN202410251182.3
申请日:2024-03-06
Applicant: 北京理工大学 , 中科信息安全共性技术国家工程研究中心有限公司
IPC: G06F21/62 , G06N20/00 , G06N3/0475 , G06N3/094
Abstract: 一种面向自注意力模型的干净标签后门攻击方法针对干净标签场景后门攻击中后门难以植入导致攻击成功率低的问题,建立触发器‑靶向类标签的联系以植入后门;设计双阶段特异触发器生成器,结合视觉注意力模型解释性工具获取热点区域,并设计了后门植入/激活阶段图像加强模块增强攻击。利用本方案生成的干净标签场景下的投毒图像相较于修改标签场景下的投毒图像更加能逃避人工审查;在3%投毒率的情况下,可以取得超过80%的攻击成功率,在9%投毒率的情况下,可以取得超过95%的攻击成功率。
-
公开(公告)号:CN117636067A
公开(公告)日:2024-03-01
申请号:CN202311802280.3
申请日:2023-12-26
Applicant: 北京理工大学 , 中科信息安全共性技术国家工程研究中心有限公司
IPC: G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/094
Abstract: 一种单阶段通用触发器的干净标签后门攻击方法包括:通过预训练好的触发器生成器生成特殊单阶段通用触发器∆;通过直接添加方法和融合添加方法在内的两种触发器添加方法进行投毒数据生成;向生成的投毒数据中混合其他良性样本数据构建投毒数据集;使用构建好的投毒数据集重训练良性模型获得后门模型;测试带有触发器的中毒数据激活后门,获得模型输出靶向类标签的成功率以及测试模型的正常对良性样本的识别准确率。有益效果在于:本方案生成的干净标签场景下的投毒图像相较于修改标签场景下的投毒图像更加能逃避人工审查;在攻击效果上,实验验证了本方案可以取得98.65%的高效攻击成功率,在模型原始功能上取得97.71%的干净样本准确率。
-
-