-
公开(公告)号:CN113837244A
公开(公告)日:2021-12-24
申请号:CN202111035380.9
申请日:2021-09-02
Applicant: 哈尔滨工业大学
Abstract: 本发明公开了一种基于多层显著性特征的对抗样本检测方法及装置,其中,该方法包括:建立一组干净样本和基于不同攻击方法的对抗样本集合,并输入至n个卷积层中;基于n个卷积层,使用非归一化的guided Grad‑CAM在每个卷积层计算干净样本和对抗样本集合的非归一化显著图;从每个非归一化显著图中提取预定义的m个纹理和统计特征,再将所有卷积层的n×m个特征作为判别特征;利用判别特征训练独立于目标模型的检测器,以检测待测样本是否是对抗样本。该方法将可解释性方法应用于模型识别的不同处理阶段,可以了解模型针对干净样本和对抗样本在不同隐藏层的决策依据,且通过非归一化方法减少丢失对抗样本在模型不同攻击阶段下的表现出的异常行为。
-
公开(公告)号:CN112766401B
公开(公告)日:2022-03-01
申请号:CN202110120845.4
申请日:2021-01-28
Applicant: 哈尔滨工业大学
IPC: G06V10/774 , G06N3/04
Abstract: 本发明公开了一种基于显著性对抗训练的对抗样本防御方法,包括:利用投影梯度下降法生成对抗样本;利用可解释性方法获取模型对于对抗样本的显著图;将显著图划分为预设数量的小块样本,并计算每个小块样本的平均显著值,每个小块样本根据对应位置的平均显著值进行JPEG压缩;将显著性压缩后的对抗样本作为训练数据进行对抗训练。在测试时,将显著性压缩后的样本输入模型进行识别。该方法提升模型的对抗鲁棒性,提升模型对于对抗样本的识别准确率。
-
公开(公告)号:CN118296451A
公开(公告)日:2024-07-05
申请号:CN202410285797.8
申请日:2024-03-13
Applicant: 哈尔滨工业大学
IPC: G06F18/241 , G06F18/213 , G06N3/0455 , G06N3/0475 , G06N3/094
Abstract: 一种基于注意力信息瓶颈的对抗训练方法,它涉及一种对抗训练方法。本发明为了解决基于单步和迭代攻击的对抗训练会会导致在干净的测试集上表现不佳,且对抗训练只能包含有限的攻击类型,限制了模型对未知攻击泛化能力的问题。本发明的步骤包括步骤1、提取对抗性决策依据;步骤2、鲁棒特性分类。本发明属于数据处理技术领域。
-
公开(公告)号:CN112766401A
公开(公告)日:2021-05-07
申请号:CN202110120845.4
申请日:2021-01-28
Applicant: 哈尔滨工业大学
Abstract: 本发明公开了一种基于显著性对抗训练的对抗样本防御方法,包括:利用投影梯度下降法生成对抗样本;利用可解释性方法获取模型对于对抗样本的显著图;将显著图划分为预设数量的小块样本,并计算每个小块样本的平均显著值,每个小块样本根据对应位置的平均显著值进行JPEG压缩;将显著性压缩后的对抗样本作为训练数据进行对抗训练。在测试时,将显著性压缩后的样本输入模型进行识别。该方法提升模型的对抗鲁棒性,提升模型对于对抗样本的识别准确率。
-
-
-