基于F0子带的虚假音频检测方法及其系统

    公开(公告)号:CN115050391A

    公开(公告)日:2022-09-13

    申请号:CN202210501881.X

    申请日:2022-05-09

    Applicant: 安徽大学

    Inventor: 范存航 薛军 吕钊

    Abstract: 本发明公开了一种基于F0子带的虚假音频检测方法,包括以下步骤:S1:提取原始语音波形的对数功率谱特征,将对数功率谱特征的F0子带作为虚假音频检测的输入特征;S2:采用全局交互模块对输入特征进行建模,获取多尺度声学特征;S3:采用局部注意模块聚焦局部信息,获取F0子带中的鉴别特征。还公开了一种基于F0子带的虚假音频检测系统,包括语音特征输入模块、全局交互模块、局部注意模块。本发明首次将F0子带特征用于虚假音频检测,能够显著提高虚假音频检测的准确率。

    基于数据引导特征蒸馏的虚假音频检测方法及其系统

    公开(公告)号:CN116434756A

    公开(公告)日:2023-07-14

    申请号:CN202310460757.8

    申请日:2023-04-25

    Applicant: 安徽大学

    Abstract: 本发明公开了一种基于数据引导特征蒸馏的虚假音频检测方法,包括以下步骤:对原始音频提取出对数功率谱,使用其F0子带作为网络的输入特征;对原始数据进行数据增强,并预训练得到教师模型;使用原始数据训练的模型作为学生模型,计算预测值与标签的损失,教师模型在浅层和深层特征上对学生模型进行指导;教师模型在预测维度进一步进行指导并平衡损失,防止学生模型过度拟合原始数据;设置训练轮次对模型进行训练,选取再好效果的模型进行测试,最深层网络输出作为预测结果。还公开了一种基于数据引导特征蒸馏的虚假音频检测系统。本发明首次将基于数据引导的特征蒸馏用于虚假音频检测,能够显著提高虚假音频检测低质量环境下的鲁棒性。

    基于联合训练的噪声鲁棒伪造语音检测系统及其方法

    公开(公告)号:CN115331686A

    公开(公告)日:2022-11-11

    申请号:CN202210509197.6

    申请日:2022-05-11

    Applicant: 安徽大学

    Abstract: 本发明公开了一种基于联合训练的噪声鲁棒伪造语音检测系统,包括:语音增强模块用于利用深度神经网络对原始输入带噪语音进行增强处理,以去除背景噪声;语音融合模块用于将增强后的语音与原始输入带噪语音进行线性加权融合,获得融合语音,实现语谱补偿,保存伪造痕迹;伪造检测模块用于对融合后的语音提取对数功率谱特征,基于低频段特征建模,获得对语音的真伪预测结果;联合训练模块用于联合训练和优化语音增强模块与伪造检测模块。还公开了一种基于联合训练的噪声鲁棒伪造语音检测方法。本发明在伪造语音检测领域引入语音增强技术,并采用语音融合模块和联合训练模块,提升语音增强的效果,使伪造语音检测系统在带噪环境下可以保持鲁棒性。

    基于复数谱子带融合的虚假音频检测方法及其系统

    公开(公告)号:CN114238849A

    公开(公告)日:2022-03-25

    申请号:CN202111481834.5

    申请日:2021-12-06

    Applicant: 安徽大学

    Abstract: 本发明公开了一种基于复数谱子带融合的虚假音频检测方法,包括以下步骤:S1:提取原始语音波形的复数谱特征和对数功率谱特征,作为输入特征;S2:将复数谱特征分为低频和高频两个子带频段,分别对复数谱的高、低频段进行建模,并获得相对应的预测结果;S3:对对数功率谱的低频段特征进行建模,并获得相对应的预测结果;S4:将复数谱的高、低两个子带频段的预测结果通过一级融合算法进行融合,得到一级融合结果;S5:将对数功率谱的低频段特征得到的预测结果和一级融合结果通过二级融合算法进行融合,得到最终结果。还公开了一种基于复数谱子带融合的虚假音频检测系统。本发明能够显著提高音频伪造检测技术的准确率。

    基于自我知识蒸馏的虚假音频检测方法及其系统

    公开(公告)号:CN116312628A

    公开(公告)日:2023-06-23

    申请号:CN202310135374.3

    申请日:2023-02-09

    Applicant: 安徽大学

    Abstract: 本发明公开了一种基于自我知识蒸馏的虚假音频检测方法,包括以下步骤:S1:提取原始语音波形的对数功率谱特征的F0子带作为虚假音频检测的输入特征;S2:采用深度神经网络对输入特征进行建模,计算标签和网络输出的损失,用以提取训练集的隐藏知识;S3:划分网络,计算所有浅层网络和最深层网络预测输出的损失,将最深层网络作为教师模型,浅层网络后端添加分类器构成学生模型,教师模型根据预测结果指导学生模型,用以增强浅层网络;S4:在特征维度,教师模型蒸馏知识到学生模型,用以平衡深浅层网络的特征差异。还公开了一种基于自我知识蒸馏的虚假音频检测系统。本发明能够显著提高虚假音频检测的准确率。

Patent Agency Ranking