基于数据引导特征蒸馏的虚假音频检测方法及其系统

    公开(公告)号:CN116434756A

    公开(公告)日:2023-07-14

    申请号:CN202310460757.8

    申请日:2023-04-25

    Applicant: 安徽大学

    Abstract: 本发明公开了一种基于数据引导特征蒸馏的虚假音频检测方法,包括以下步骤:对原始音频提取出对数功率谱,使用其F0子带作为网络的输入特征;对原始数据进行数据增强,并预训练得到教师模型;使用原始数据训练的模型作为学生模型,计算预测值与标签的损失,教师模型在浅层和深层特征上对学生模型进行指导;教师模型在预测维度进一步进行指导并平衡损失,防止学生模型过度拟合原始数据;设置训练轮次对模型进行训练,选取再好效果的模型进行测试,最深层网络输出作为预测结果。还公开了一种基于数据引导特征蒸馏的虚假音频检测系统。本发明首次将基于数据引导的特征蒸馏用于虚假音频检测,能够显著提高虚假音频检测低质量环境下的鲁棒性。

Patent Agency Ranking