一种基于语义空间扰动的语音识别模型安全性测评方法

    公开(公告)号:CN116758899A

    公开(公告)日:2023-09-15

    申请号:CN202311008778.2

    申请日:2023-08-11

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于语义空间扰动的语音识别模型安全性测评方法,包括(1)选择目标指令,将指令文本输入给预训练语音合成模型获得命令的原始语义特征、原始梅尔频谱和原始对齐信息;(2)初始化特征扰动为0;(3)将特征扰动加到命令的原始语义特征上,将加扰后的语义特征输入给语音合成模型的解码器,获得新的梅尔频谱和新的对齐信息;(4)将获得的梅尔频谱进行模糊化,并输入声码器获得音频;(5)将音频输入给待测目标语音识别模型获得识别结果;(6)如果识别结果和目标命令相同则保留音频;(7)计算损失并更新特征扰动;(8)回到步骤(3)直到扰动超过阈值或到达最大迭代次数;(9)检查最终是否通过步骤(6)保留了音频。

    基于跨领域自适应的深度伪造语音检测方法

    公开(公告)号:CN116153331A

    公开(公告)日:2023-05-23

    申请号:CN202211533985.5

    申请日:2022-12-01

    Abstract: 本发明公开了一种基于跨领域自适应的深度伪造语音检测方法及装置,涉及语音检测技术领域。该方法包括:获取跨语种音频数据集;从跨语种音频数据集随机抽取的包含源语种及目标语种真伪音频数据的N个音频数据输入至特征提取器进行音频特征提取;将音频特征分别输入至真伪分类器、语种分类器、差异测量器,计算得到真伪分类损失参数、语种分类损失参数和语种间特征差异损失参数;根据真伪分类损失参数、语种分类损失参数和语种间特征差异损失参数,以减小总损失为优化目标,采用优化算法对神经网络模型进行参数优化及更新;重复上述步骤得到深度伪造语音检测模型,通过该深度伪造语音检测模型可实现对不同语种待测音频数据真伪的精确识别。

    一种针对受软件噪声影响的相机指纹的匹配方法及装置

    公开(公告)号:CN115830650A

    公开(公告)日:2023-03-21

    申请号:CN202211715794.0

    申请日:2022-12-29

    Abstract: 本发明公开了一种针对受软件噪声影响的相机指纹的匹配方法及装置,该方法包括:获取待测图像Iq和目标匹配相机指纹Kr;根据所述待测图像Iq,提取对应的待测相机指纹Kq并与目标匹配相机指纹Kr计算基本相似度Cor_pair;估计目标匹配相机指纹Kr对应的设备型号和拍摄软件的软件噪声相似度Cor_software_noise;计算Cor_pair与Cor_software_noise的比值Ratio作为新的相机指纹相似度,并将比值Ratio与预设阈值对比,得到匹配结果。通过计算待测相机指纹与同型号其他设备相机指纹计算相似度并取平均值,估计软件噪声对相似度的影响程度,避开逆向工程等复杂方案推导软件噪声的产生过程。同时,通过比值的方式得出Ratio,直接判别待测相机指纹与目标匹配相机指纹之间的相似度中存不存在相同成分,得出匹配结果。

    基于神经网络生成模型的音素级声纹识别对抗样本构造系统和方法

    公开(公告)号:CN114093371A

    公开(公告)日:2022-02-25

    申请号:CN202111178765.0

    申请日:2021-10-11

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于神经网络生成模型的音素级声纹识别对抗样本构造系统和方法,系统包括音素识别器、扰动生成器、听感抑制器、替代分类器和系统优化器,听感抑制器生成受抑制扰动与音素识别器生成的对齐语音叠加生成对抗样本,对抗样本通过替代分类器分类将分数发送至系统优化器并将梯度反向传播给扰动生成器进行迭代更新,得到一个训练好的音素扰动生成器。本发明创新性地提出融合语音中的音素信息进行扰动构造,利用音素识别器识别和定位语音中的音素并在音素级别生成细粒度的通用对抗扰动,从而使得一步生成的对抗扰动能够重用于任意语音文本输入,最终实现文本无关、输入无关的通用对抗样本生成,极大提升对抗样本的生成效率。

Patent Agency Ranking