一种基于反义词替换的文本对抗攻击方法

    公开(公告)号:CN119538923A

    公开(公告)日:2025-02-28

    申请号:CN202411616617.6

    申请日:2024-11-13

    Applicant: 扬州大学

    Abstract: 本发明公开了一种基于反义词替换的文本对抗攻击方法,包括1)通过LAC、HanLP、LTP分词和词性标注工具对原始文本进行分词,并标注出其中的形容词;2)利用OpenHowNet对未标注的文本进一步筛选,生成与正向或负向形容词相关的词汇库,并对相似度大于阈值的词语进行标注;3)采用基于贪心算法和词语重要性排序的搜索算法,根据重要性分数对词语进行排序,确定文本中各个词的扰动顺序;4)基于筛选和人工标注结果,构建出一个完整的反义词库,并对标注出的形容词进行扰动,生成高相似度且可读的对抗文本。本发明基于反义词替换策略,提出通过特殊结构进行文本扰动,使生成的对抗文本既保持原文本的语义相似度,又能够有效干扰情感分类模型的判断。

Patent Agency Ranking