一种针对NLP模型的轻量且高隐蔽性的黑盒攻击方法

    公开(公告)号:CN115563486A

    公开(公告)日:2023-01-03

    申请号:CN202211165542.5

    申请日:2022-09-23

    Abstract: 本发明公开了一种针对NLP模型的轻量且高隐蔽性的黑盒攻击方法。本发明步骤:1、依据受害样本集、目标模型、分类标签、攻击比率调用词重要性计算算法,确定受害词;2、依据受害词、词的历史信息表、分类标签、候选词表预算,调用构建候选词表算法,确定受害词的候选词表候选词表;3、计算受害词和对应候选词在受害文本中的置信度分数差值,更新该受害词的历史信息表;同时调用文本相似函数和置信度分数计算算法,确定对抗样本。本发明通过优化改进词转换阶段的方法,同时使用历史攻击信息并进行统计检验,减小候选词表的大小,从而降低目标模型查询词袋的次数,增强攻击的隐蔽性,降低安全系统检测风险。

Patent Agency Ranking