一种基于生成对抗网络的高效补丁攻击方法

    公开(公告)号:CN118230096A

    公开(公告)日:2024-06-21

    申请号:CN202410441282.2

    申请日:2024-04-12

    Abstract: 本发明属于深度学习的对抗样本领域,公开一种基于生成对抗网络的高效补丁攻击方法。为解决对抗补丁会遮挡人脸关键位置并且显眼的问题,我们提出使用生成对抗网络生成逼真的补丁,并将其贴在额头处,这样便不会遮挡住人脸关键位置的同时保持自然性;为解决现有脸部补丁迁移成功率低的问题,我们将贴上对抗补丁的对抗样本输入到替代模型上进行优化,并且使用注意力损失和分类损失对其损失函数进行优化,然后与基于迁移的攻击方法进行结合。本发明能够在不遮挡人脸关键位置的情况下,制作出具有自然性并且保持高迁移成功率的对抗补丁,能够对现有的深度学习模型尤其是人脸分类模型造成更大威胁,从而推动深度学习领域对于模型鲁棒性和安全性的思考。

Patent Agency Ranking