-
公开(公告)号:CN118298832A
公开(公告)日:2024-07-05
申请号:CN202410332064.5
申请日:2024-03-22
Applicant: 南京邮电大学
IPC: G10L17/02 , G06F18/241 , G06F18/213 , G06F18/214 , G06N3/048 , G06F18/25 , G10L17/04 , G10L17/06 , G10L17/18 , G10L17/22 , G10L25/24 , G10L25/30 , G10L25/51
Abstract: 本发明公开了一种基于特征增强注意力机制的语音欺骗检测方法,包括训练阶段和测试阶段,在训练阶段获取训练语料并进行预处理,构建语音欺骗检测模型,将训练语料的声学特征输入到检测模型中进行模型训练,检测模型包括特征提取和分类两大部分,在特征提取中提出特征增强注意力机制,包括局部编码模块和全局感知模块,局部编码模块用于聚合局部特征区域,全局感知模块用于捕获特征的全局远程依赖关系,然后将提取到的局部特征和全局特征进行融合得到增强特征,并输入至分类器中进行真伪分类;然后在测试阶段完成对真实语音和合成语音真伪的检测,实现高质量的语音欺骗检测。
-
公开(公告)号:CN119296582A
公开(公告)日:2025-01-10
申请号:CN202411391986.X
申请日:2024-10-08
Applicant: 南京邮电大学
IPC: G10L25/51 , G10L25/69 , G10L25/30 , G10L25/03 , G06F18/24 , G06F18/213 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 本发明公开了一种基于注意力和双特征的深度伪造音频检测方法,包括训练阶段和测试阶段,在训练阶段获取训练数据并进行预处理,构建双特征深度伪造音频检测模型,将训练数据的手工声学特征和原始波形特征输入到各自检测支路中进行模型训练;分别在两个模型的特征提取模块中加入注意力块,该注意力块由空间局部注意力和频谱全局注意力组成,空间局部注意力用于聚焦特征的局部敏感区域,频谱全局注意力用于捕获特征之间的跨通道相关性,即捕获特征的长程依赖关系,然后将其拼接融合输出,输入至分类模块中进行真伪分类;最后在测试阶段训练好的检测模型,完成对真实语音和合成语音的真伪检测,实现高质量的深度伪造音频检测。
-