基于跨领域自适应的深度伪造语音检测方法

    公开(公告)号:CN116153331A

    公开(公告)日:2023-05-23

    申请号:CN202211533985.5

    申请日:2022-12-01

    Abstract: 本发明公开了一种基于跨领域自适应的深度伪造语音检测方法及装置,涉及语音检测技术领域。该方法包括:获取跨语种音频数据集;从跨语种音频数据集随机抽取的包含源语种及目标语种真伪音频数据的N个音频数据输入至特征提取器进行音频特征提取;将音频特征分别输入至真伪分类器、语种分类器、差异测量器,计算得到真伪分类损失参数、语种分类损失参数和语种间特征差异损失参数;根据真伪分类损失参数、语种分类损失参数和语种间特征差异损失参数,以减小总损失为优化目标,采用优化算法对神经网络模型进行参数优化及更新;重复上述步骤得到深度伪造语音检测模型,通过该深度伪造语音检测模型可实现对不同语种待测音频数据真伪的精确识别。

Patent Agency Ranking