基于多层显著性特征的对抗样本检测方法及装置

    公开(公告)号:CN113837244A

    公开(公告)日:2021-12-24

    申请号:CN202111035380.9

    申请日:2021-09-02

    Abstract: 本发明公开了一种基于多层显著性特征的对抗样本检测方法及装置,其中,该方法包括:建立一组干净样本和基于不同攻击方法的对抗样本集合,并输入至n个卷积层中;基于n个卷积层,使用非归一化的guided Grad‑CAM在每个卷积层计算干净样本和对抗样本集合的非归一化显著图;从每个非归一化显著图中提取预定义的m个纹理和统计特征,再将所有卷积层的n×m个特征作为判别特征;利用判别特征训练独立于目标模型的检测器,以检测待测样本是否是对抗样本。该方法将可解释性方法应用于模型识别的不同处理阶段,可以了解模型针对干净样本和对抗样本在不同隐藏层的决策依据,且通过非归一化方法减少丢失对抗样本在模型不同攻击阶段下的表现出的异常行为。

    基于显著性对抗训练的对抗样本防御方法

    公开(公告)号:CN112766401B

    公开(公告)日:2022-03-01

    申请号:CN202110120845.4

    申请日:2021-01-28

    Inventor: 王莘 宫羽欣

    Abstract: 本发明公开了一种基于显著性对抗训练的对抗样本防御方法,包括:利用投影梯度下降法生成对抗样本;利用可解释性方法获取模型对于对抗样本的显著图;将显著图划分为预设数量的小块样本,并计算每个小块样本的平均显著值,每个小块样本根据对应位置的平均显著值进行JPEG压缩;将显著性压缩后的对抗样本作为训练数据进行对抗训练。在测试时,将显著性压缩后的样本输入模型进行识别。该方法提升模型的对抗鲁棒性,提升模型对于对抗样本的识别准确率。

    基于显著性对抗训练的对抗样本防御方法

    公开(公告)号:CN112766401A

    公开(公告)日:2021-05-07

    申请号:CN202110120845.4

    申请日:2021-01-28

    Inventor: 王莘 宫羽欣

    Abstract: 本发明公开了一种基于显著性对抗训练的对抗样本防御方法,包括:利用投影梯度下降法生成对抗样本;利用可解释性方法获取模型对于对抗样本的显著图;将显著图划分为预设数量的小块样本,并计算每个小块样本的平均显著值,每个小块样本根据对应位置的平均显著值进行JPEG压缩;将显著性压缩后的对抗样本作为训练数据进行对抗训练。在测试时,将显著性压缩后的样本输入模型进行识别。该方法提升模型的对抗鲁棒性,提升模型对于对抗样本的识别准确率。

Patent Agency Ranking