-
公开(公告)号:CN112766336A
公开(公告)日:2021-05-07
申请号:CN202110028632.9
申请日:2021-01-08
Applicant: 之江实验室
Abstract: 本发明属于深度学习安全领域,涉及一种最大化随机平滑下提高模型可验证防御性能的方法,包括:步骤1、基于可微的连续映射函数推导出平滑分类器可验证防御半径与原始分类器输出之间的梯度关系;步骤2、采用平滑映射生成在可行域极值处的无穷小乘项与概率阈值限制可验证防御梯度值爆炸;步骤3、基于防御性能与准确率梯度推导可求解的目标函数;步骤4、基于目标优化函数对模型进行鲁棒性训练以实现最大化模型可验证防御。本发明通用于任意的深度学习以及机器学习分类器,首次求解了随机平滑技术下平滑分类器的可验证防御性能与原始分类器输出之间的梯度关系,解决了求解过程梯度爆炸问题,极大地提升了随机平滑下模型鲁棒性的训练效率。