一种硬标签黑盒场景下自然对抗文本生成方法及装置

    公开(公告)号:CN115329836A

    公开(公告)日:2022-11-11

    申请号:CN202210777660.5

    申请日:2022-07-04

    Abstract: 本发明公开一种硬标签黑盒场景下自然对抗文本生成方法及装置,该方法通过获取数据集中的离散文本X,通过重要单词鉴别器识别所述离散文本X中的重要单词,根据重要单词鉴别器的重要单词识别结果生成重要单词集合I;采用掩语言模型对重要单词集合I的每个重要单词生成候选单词集合,对重要单词集合I中的指定重要单词采用对应的候选单词集合中的词进行替换,以生成初始化的对抗文本X*;最终利用遗传算法对生成的对抗样本X*迭代的进行变异、选择及交叉操作,得到具有指定语义相似度的优化的对抗样本Xadv。本申请攻击成功率高,具有较好的流畅性和语法正确性。

    对抗样本生成方法、装置、电子设备及存储介质

    公开(公告)号:CN115688915A

    公开(公告)日:2023-02-03

    申请号:CN202211085668.1

    申请日:2022-09-06

    Abstract: 本申请提供的一种对抗样本生成方法、装置、电子设备及存储介质,包括:获取样本数据,将样本数据作为初始数据,基于语义分类器计算初始数据中的每个单词的重要性得分,基于重要性得分对单词进行排序;利用基于转换器的双向编码表征算法计算每个单词的同义词集合及每个同义词的语义得分;基于排序顺序选取一个单词为待替换单词,基于待替换单词的同义词集合及每个同义词的语义得分,计算待替换单词的每个同义词的攻击性得分;选取攻击性得分最高的同义词,在初始数据中替换待替换单词,生成待测试数据;判断待测试数据能否完成对样本数据的攻击行为,若是,则将待测试数据作为样本数据的对抗样本。

Patent Agency Ranking