一种语音转换说话人溯源方法及装置

    公开(公告)号:CN116665687A

    公开(公告)日:2023-08-29

    申请号:CN202310236391.6

    申请日:2023-03-10

    Applicant: 武汉大学

    Abstract: 本发明公开了一种语音转换说话人溯源方法及装置。针对语音转换技术在实际应用过程中滥用时难以主动追溯源说话人身份的问题,本发明设计了一个基于异步VAE‑Glow的追溯方法,既能在语音转换过程中并行隐藏源说话人身份,又能从压缩的转换语音中准确地恢复隐藏的源说话人身份甚至原始语音。本方法可与任意的语音转换框架集成并用于各类社交媒体和语音通话应用中,在不影响转换语音质量的前提下实现说话人身份的隐藏和溯源,在面临大范围比特率(16~128kbps)的主流音频和语音压缩标准(如AAC、MP3、Opus和SILK)时仅凭0.74s的语音就能实现接近100%的溯源准确率。

    一种针对说话人识别系统的语音对抗防御方法及系统

    公开(公告)号:CN119943057A

    公开(公告)日:2025-05-06

    申请号:CN202510022873.0

    申请日:2025-01-07

    Applicant: 武汉大学

    Abstract: 本发明提供一种针对说话人识别系统的语音对抗防御方法及系统,提出一种新型的对抗净化框架SA‑Net,其关键思路是在特征层面采用“先减法后加法”策略,减法步骤通过分析说话人特征的分布,过滤掉非鲁棒特征,从而压缩对抗噪声的生存空间;加法步骤则重建完整的语音信号,使得说话人识别系统能够准确识别,而无需额外的微调或重新训练。本发明在两个开源的SRS上对于抵御自适应攻击时的平均防御准确率达到87.8%,同时保持了98.5%的正常识别准确率,分别比Parallel WaveGAN高出29.3%和2.8%。此外,本发明具有较强的防御能力和广泛的适用性,可作为各种部署中的SRS的即插即用防线。

Patent Agency Ranking