-
公开(公告)号:CN113326356B
公开(公告)日:2021-11-02
申请号:CN202110884051.5
申请日:2021-08-03
Applicant: 北京邮电大学
Abstract: 本公开提供一种针对文本分类器的自然对抗样本生成方法及相关装置,将文本样本所对应的离散向量映射到连续空间中,并利用梯度在连续空间中寻找通用扰动,并通过控制噪声的更新阈值来进一步平衡攻击率和自然性之间的关系。通过这种通用扰动生成对抗样本,能够保证样本集中任意样本添加通用扰动后,均具有良好的自然语言特性,并保持了与原始样本高度的相似性,由此高效和准确的实现了针对文本分类器的自然对抗样本的生成。
-
公开(公告)号:CN115329836A
公开(公告)日:2022-11-11
申请号:CN202210777660.5
申请日:2022-07-04
Applicant: 北京邮电大学
IPC: G06K9/62 , G06F40/284 , G06N3/04 , G06N3/08
Abstract: 本发明公开一种硬标签黑盒场景下自然对抗文本生成方法及装置,该方法通过获取数据集中的离散文本X,通过重要单词鉴别器识别所述离散文本X中的重要单词,根据重要单词鉴别器的重要单词识别结果生成重要单词集合I;采用掩语言模型对重要单词集合I的每个重要单词生成候选单词集合,对重要单词集合I中的指定重要单词采用对应的候选单词集合中的词进行替换,以生成初始化的对抗文本X*;最终利用遗传算法对生成的对抗样本X*迭代的进行变异、选择及交叉操作,得到具有指定语义相似度的优化的对抗样本Xadv。本申请攻击成功率高,具有较好的流畅性和语法正确性。
-
公开(公告)号:CN115688915A
公开(公告)日:2023-02-03
申请号:CN202211085668.1
申请日:2022-09-06
Applicant: 北京邮电大学
IPC: G06N3/094 , G06F16/35 , G06F40/30 , G06F40/289 , G06N3/04
Abstract: 本申请提供的一种对抗样本生成方法、装置、电子设备及存储介质,包括:获取样本数据,将样本数据作为初始数据,基于语义分类器计算初始数据中的每个单词的重要性得分,基于重要性得分对单词进行排序;利用基于转换器的双向编码表征算法计算每个单词的同义词集合及每个同义词的语义得分;基于排序顺序选取一个单词为待替换单词,基于待替换单词的同义词集合及每个同义词的语义得分,计算待替换单词的每个同义词的攻击性得分;选取攻击性得分最高的同义词,在初始数据中替换待替换单词,生成待测试数据;判断待测试数据能否完成对样本数据的攻击行为,若是,则将待测试数据作为样本数据的对抗样本。
-
公开(公告)号:CN113326356A
公开(公告)日:2021-08-31
申请号:CN202110884051.5
申请日:2021-08-03
Applicant: 北京邮电大学
Abstract: 本公开提供一种针对文本分类器的自然对抗样本生成方法及相关装置,将文本样本所对应的离散向量映射到连续空间中,并利用梯度在连续空间中寻找通用扰动,并通过控制噪声的更新阈值来进一步平衡攻击率和自然性之间的关系。通过这种通用扰动生成对抗样本,能够保证样本集中任意样本添加通用扰动后,均具有良好的自然语言特性,并保持了与原始样本高度的相似性,由此高效和准确的实现了针对文本分类器的自然对抗样本的生成。
-
-
-