-
公开(公告)号:CN111462768B
公开(公告)日:2023-04-25
申请号:CN202010168942.6
申请日:2020-03-12
Applicant: 南京邮电大学
IPC: G10L21/013 , G10L19/00 , G10L13/04 , G10L25/18 , G10L25/48 , G06N3/094 , G06N3/0464 , G06N3/047
Abstract: 本发明公开了一种基于共享训练的多尺度StarGAN的语音转换方法,使用多尺度StarGAN结构,在不同级别上来表示多尺度特征并且增加了每层网络的感受野范围,同时使用残差连接,缓解梯度消失的问题,使得网络能够更深层次地传播,显著地提升了转换后的语音质量,进一步使用Share‑Learning训练鉴别器和分类器的共享模块Share‑Block,不仅能够减少模型参数,而且共享模块的参数可以同时训练到,能够加快鉴别器和分类器训练过程,提升鉴别器和分类器的性能,实现了一种高质量的语音转换方法,在跨语种语音转换、电影配音、语音翻译和医疗辅助等领域有很好的应用前景。
-
公开(公告)号:CN111462768A
公开(公告)日:2020-07-28
申请号:CN202010168942.6
申请日:2020-03-12
Applicant: 南京邮电大学
Abstract: 本发明公开了一种基于共享训练的多尺度StarGAN的语音转换方法,使用多尺度StarGAN结构,在不同级别上来表示多尺度特征并且增加了每层网络的感受野范围,同时使用残差连接,缓解梯度消失的问题,使得网络能够更深层次地传播,显著地提升了转换后的语音质量,进一步使用Share-Learning训练鉴别器和分类器的共享模块Share-Block,不仅能够减少模型参数,而且共享模块的参数可以同时训练到,能够加快鉴别器和分类器训练过程,提升鉴别器和分类器的性能,实现了一种高质量的语音转换方法,在跨语种语音转换、电影配音、语音翻译和医疗辅助等领域有很好的应用前景。
-