-
公开(公告)号:CN116757274A
公开(公告)日:2023-09-15
申请号:CN202310818420.X
申请日:2023-07-04
Applicant: 广东工业大学
IPC: G06N3/094 , G06N3/0475 , G06V10/74 , G06V10/82
Abstract: 本发明公开了一种基于相同语义特征的对抗样本生成方法与系统,涉及人工智能安全的技术领域,包括获取原始图像样本并对应生成扰动样本,输入待攻击的神经网络模型,计算第一相似性分数和第二相似性分数;对相似性分数设置权重因子调整扰动样本,获得优化后的扰动样本;计算优化后的扰动样本的上界并进行约束,获得初始对抗样本;判断初始对抗样本是否满足预设要求,若不满足,将初始对抗样本作为新的扰动样本进行新一轮迭代,否则获得最终对抗样本。本发明稳定性和成功率高,不限制特定的数据集,使得生成的对抗样本更具有普适性和可迁移性,且误导分类器时保持高度不可感知,提高了对抗攻击的可靠性和实用性,达到有效欺骗分类器的目的。