-
公开(公告)号:CN119047536A
公开(公告)日:2024-11-29
申请号:CN202411086904.0
申请日:2024-08-08
Applicant: 西南交通大学唐山研究院
IPC: G06N3/094 , G06N3/0475 , G06N3/096 , G06N3/0455 , G06V10/764 , G06V10/82 , G06V10/25 , G06F21/71
Abstract: 本发明提供了一种基于扩散模型的对抗攻击方法,属于图像分类的对抗攻击领域,该方法包括:获取文本,并使用多模态目标检测模型预测图像中文本对应的检测框;使用分割大模型预测检测框对应的遮罩,并整合遮罩集合得到对抗攻击的目标区域;获取图像,并利用稳定扩散模型将图像映射至图像对应的潜在空间中,并保存每一步的潜在向量;迭代对抗攻击并对潜在空间添加扰动,并结合目标区域和潜在向量,利用将扩散过程和区域选择引入对抗攻击的策略生成对抗样本,完成基于扩散模型的对抗攻击。本发明构建基于扩散模型的对抗攻击方法,大幅提高对抗样本的视觉质量,使扰动难以察觉,并大幅提升对抗样本的黑盒迁移能力,在模型安全性验证中具有广泛的应用前景。