-
公开(公告)号:CN119943063A
公开(公告)日:2025-05-06
申请号:CN202510436285.1
申请日:2025-04-09
Applicant: 北京邮电大学
Abstract: 本发明涉及语音防克隆领域,尤其涉及基于不可学习语音样本的语音防克隆方法及装置,该方法包括:获取待保护语音样本以及待保护语音样本对应的文本信息;以目标函数最小为优化目标对待保护语音样本中添加的扰动进行更新迭代,得到目标扰动;其中,目标函数包括用于衡量待保护语音样本与合成语音之间的距离的第一损失、衡量扰动的语音特征隐藏特性的第二损失和衡量扰动的听觉不可感知特性的第三损失;将目标扰动添加到待保护语音样本中,得到不可学习语音样本。通过本申请能够通过更新得到的目标扰动生成不可学习语音样本,以使目标语音合成模型无法学习到说话人的语音特征,进而在语音合成过程中防止语音克隆。
-
公开(公告)号:CN119920239A
公开(公告)日:2025-05-02
申请号:CN202510398578.5
申请日:2025-04-01
Applicant: 北京邮电大学
IPC: G10L15/02 , G10L15/06 , G10L15/065 , G10L15/16 , G06N3/0475 , G06N3/084 , G06N3/094
Abstract: 本申请提供了一种语音对抗样本生成方法、装置及电子设备,涉及语音处理技术领域,所述方法包括:接收输入的音频信号,在潜在空间中对音频信号进行编码,获得潜在特征编码;从构建的可迁移扰动集中选取一扰动添加在潜在特征编码上,获得扰动后的潜在特征编码;对扰动后的潜在特征编码进行解码,获得语音对抗样本。通过采用上述语音对抗样本生成方法、装置及电子设备,解决了现有语音对抗样本生成方法,导致音频质量下降的问题。
-