一种基于注意力和双特征的深度伪造音频检测方法

    公开(公告)号:CN119296582A

    公开(公告)日:2025-01-10

    申请号:CN202411391986.X

    申请日:2024-10-08

    Abstract: 本发明公开了一种基于注意力和双特征的深度伪造音频检测方法,包括训练阶段和测试阶段,在训练阶段获取训练数据并进行预处理,构建双特征深度伪造音频检测模型,将训练数据的手工声学特征和原始波形特征输入到各自检测支路中进行模型训练;分别在两个模型的特征提取模块中加入注意力块,该注意力块由空间局部注意力和频谱全局注意力组成,空间局部注意力用于聚焦特征的局部敏感区域,频谱全局注意力用于捕获特征之间的跨通道相关性,即捕获特征的长程依赖关系,然后将其拼接融合输出,输入至分类模块中进行真伪分类;最后在测试阶段训练好的检测模型,完成对真实语音和合成语音的真伪检测,实现高质量的深度伪造音频检测。

Patent Agency Ranking