-
公开(公告)号:CN115510440B
公开(公告)日:2023-09-08
申请号:CN202211155036.8
申请日:2022-09-21
Applicant: 中国工程物理研究院计算机应用研究所
Abstract: 本发明公开了一种基于NES算法的黑盒模型反演攻击方法及系统,属于人工智能安全领域,解决现有技术中基于优化的反演攻击方法实用性相对较低,和基于模型训练的反演攻击方法隐藏性差、耗时长等问题。本发明基于给定的数据集训练一对GAN模型,包括与被攻击模型的输入类型相同的G模型和对G模型的输出进行评分的D模型,其中,被攻击模型即为目标模型;基于训练好的G模型和D模型,结合目标模型的输出,对目标模型发起反演攻击得到重构图像。本发明用于黑盒模型反演攻击。
-
公开(公告)号:CN115659171B
公开(公告)日:2023-06-06
申请号:CN202211178731.6
申请日:2022-09-26
Applicant: 中国工程物理研究院计算机应用研究所
IPC: G06F18/214 , G06F18/2415 , G06V10/774 , G06V10/764
Abstract: 本发明涉及机器学习安全领域,提供了一种基于多元特征交互的模型后门检测方法、装置及存储介质。主旨在于提高模型后门的识别率以及降低检测实现的计算开销。主要方案包括对于一个k分类模型F,对于每个类别i∈{1,2,...,k},防御者准备大小为s的数据集将数据集的单个数据输入给模型F,得到模型F的logits层的输出向量然后对向量按类别做向量和得到用于判断后门的k维向量r,其中rm为向量r的第m个分量,rm代表所有步骤1准备的数据在F模型的logits层上第m类预测结果的logits累计值,给定阈值b,当第m类的logits累计值rm高于b时,则此类受到了模型后门攻击。
-
公开(公告)号:CN115659171A
公开(公告)日:2023-01-31
申请号:CN202211178731.6
申请日:2022-09-26
Applicant: 中国工程物理研究院计算机应用研究所
IPC: G06F18/214 , G06F18/2415 , G06V10/774 , G06V10/764
Abstract: 本发明涉及机器学习安全领域,提供了一种基于多元特征交互的模型后门检测方法、装置及存储介质。主旨在于提高模型后门的识别率以及降低检测实现的计算开销。主要方案包括对于一个k分类模型F,对于每个类别i∈{1,2,...,k},防御者准备大小为s的数据集将数据集的单个数据输入给模型F,得到模型F的logits层的输出向量然后对向量按类别做向量和得到用于判断后门的k维向量r,其中rm为向量r的第m个分量,rm代表所有步骤1准备的数据在F模型的logits层上第m类预测结果的logits累计值,给定阈值b,当第m类的logits累计值rm高于b时,则此类受到了模型后门攻击。
-
公开(公告)号:CN115510440A
公开(公告)日:2022-12-23
申请号:CN202211155036.8
申请日:2022-09-21
Applicant: 中国工程物理研究院计算机应用研究所
Abstract: 本发明公开了一种基于NES算法的黑盒模型反演攻击方法及系统,属于人工智能安全领域,解决现有技术中基于优化的反演攻击方法实用性相对较低,和基于模型训练的反演攻击方法隐藏性差、耗时长等问题。本发明基于给定的数据集训练一对GAN模型,包括与被攻击模型的输入类型相同的G模型和对G模型的输出进行评分的D模型,其中,被攻击模型即为目标模型;基于训练好的G模型和D模型,结合目标模型的输出,对目标模型发起反演攻击得到重构图像。本发明用于黑盒模型反演攻击。
-
-
-