一种基于扩散模型的对抗攻击方法

    公开(公告)号:CN119047536A

    公开(公告)日:2024-11-29

    申请号:CN202411086904.0

    申请日:2024-08-08

    Abstract: 本发明提供了一种基于扩散模型的对抗攻击方法,属于图像分类的对抗攻击领域,该方法包括:获取文本,并使用多模态目标检测模型预测图像中文本对应的检测框;使用分割大模型预测检测框对应的遮罩,并整合遮罩集合得到对抗攻击的目标区域;获取图像,并利用稳定扩散模型将图像映射至图像对应的潜在空间中,并保存每一步的潜在向量;迭代对抗攻击并对潜在空间添加扰动,并结合目标区域和潜在向量,利用将扩散过程和区域选择引入对抗攻击的策略生成对抗样本,完成基于扩散模型的对抗攻击。本发明构建基于扩散模型的对抗攻击方法,大幅提高对抗样本的视觉质量,使扰动难以察觉,并大幅提升对抗样本的黑盒迁移能力,在模型安全性验证中具有广泛的应用前景。

Patent Agency Ranking