-
公开(公告)号:CN115563486A
公开(公告)日:2023-01-03
申请号:CN202211165542.5
申请日:2022-09-23
Applicant: 杭州电子科技大学
IPC: G06F18/21 , G06F18/241 , G06F40/237 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种针对NLP模型的轻量且高隐蔽性的黑盒攻击方法。本发明步骤:1、依据受害样本集、目标模型、分类标签、攻击比率调用词重要性计算算法,确定受害词;2、依据受害词、词的历史信息表、分类标签、候选词表预算,调用构建候选词表算法,确定受害词的候选词表候选词表;3、计算受害词和对应候选词在受害文本中的置信度分数差值,更新该受害词的历史信息表;同时调用文本相似函数和置信度分数计算算法,确定对抗样本。本发明通过优化改进词转换阶段的方法,同时使用历史攻击信息并进行统计检验,减小候选词表的大小,从而降低目标模型查询词袋的次数,增强攻击的隐蔽性,降低安全系统检测风险。