-
公开(公告)号:CN115713933A
公开(公告)日:2023-02-24
申请号:CN202211423687.0
申请日:2022-11-15
Applicant: 南京邮电大学
Abstract: 本发明涉及语音转换技术领域,具体地说,是一种基于互信息量和SE注意力机制的跨语种语音转换方法,包括训练阶段和转换阶段,训练阶段包括以下步骤:首先在内容编码器中引入SE模块,通过该模块,网络可以学习获取全局信息,提升内容编码器生成的内容表征的质量;进一步引入互信息量作为相关度量,通过无监督的方式减少内容表征、说话人表征和基频特征三者两两之间的依赖性,实现高效的解纠缠;最后在解码器中将目标说话人语句中的个性信息与源说话人语句中的内容信息进行重构,从而实现高质量的跨语种语音转换。与此同时,该方法还可以对不在训练集内的说话人实现转换,即完成开集情形下任意说话人的跨语种语音转换。