-
公开(公告)号:CN116778937A
公开(公告)日:2023-09-19
申请号:CN202310314078.X
申请日:2023-03-28
Applicant: 南京工程学院
IPC: G10L21/013 , G06N3/0464 , G06N3/0475 , G06N3/094 , G10L19/16 , G10L25/18 , G10L25/24 , G10L25/30
Abstract: 本发明公开了一种基于说话人对抗子网络的语音转换方法。本发明通过在将说话人对抗子网络嵌入至语音转换模型StarGAN‑VC2中,提出了添加说话人对抗子网络辅助特征解码的策略,并融合了说话人对抗损失函数与生成器损失函数,使得二者在对抗中提高编码器的说话人身份信息去除效果,同时为了更好地适应语音转换任务,引入了自适应实例归一化算法辅助特征解码,能够有效的提升语音转换的质量以及说话人相似度,因此,使得语音在转换过程中,具有检验与反馈机制,非语义特征剔除彻底,可以在保持多对多的非平行语料转换方法优越性的前提下,创造出一个说话人身份信息去除辅助与验证机制,语音转换效果好,具有良好的应用前景。
-
公开(公告)号:CN116778937B
公开(公告)日:2024-01-23
申请号:CN202310314078.X
申请日:2023-03-28
Applicant: 南京工程学院
IPC: G10L21/013 , G06N3/0464 , G06N3/0475 , G06N3/094 , G10L19/16 , G10L25/18 , G10L25/24 , G10L25/30
Abstract: 本发明公开了一种基于说话人对抗子网络的语音转换方法。本发明通过在将说话人对抗子网络嵌入至语音转换模型StarGAN‑VC2中,提出了添加说话人对抗子网络辅助特征解码的策略,并融合了说话人对抗损失函数与生成器损失函数,使得二者在对抗中提高编码器的说话人身份信息去除效果,同时为了更好地适应语音转换任务,引入了自适应实例归一化算法辅助特征解码,能够有效的提升语音转换的质量以及说话人相似度,因此,使得语音在转换过程中,具有检验与反馈机制,非语义特征剔除彻底,可以在保持多对多的非平行语料转换方法优越性的前提下,创造出一个说话人身份信息去除辅助与验证机(56)对比文件Yutian Wang et al.FeatureQuantization for Many-to-many VoiceConversion. 2020 IEEE InternationalConference on Information Technology,BigData and Artificial Intelligence (ICIBA).2020,全文.
-