一种基于因果扩散模型的后门防御方法

    公开(公告)号:CN119416212A

    公开(公告)日:2025-02-11

    申请号:CN202411358556.8

    申请日:2024-09-27

    Abstract: 本发明涉及一种基于因果扩散模型的后门防御方法,属于基于数据集的后门攻击防御领域。包括:定义一个结构因果模型,通过因果扩散模型消除触发器,并且在反向去噪过程中解混数据本身噪声或分布所带来的图像和标签之间虚假的关联;利用因果扩散模型生成的图像的标签预测概率分布,计算KL散度之后,通过与阈值对比识别中毒样本;对于识别的中毒样本,通过构建候选集以及考虑像素和特征距离,从候选集中选择纯化图像,净化数据集。本发明将因果推理引入扩散模型净化数据集中,应用基于因果干预的后门准则来消除扩散模型反向去噪过程中的混杂偏差,确保模型能够消除虚假关联的影响以实现对中毒数据集的有效净化。

Patent Agency Ranking