基于激活指导和内卷积的跨语种语音转换方法

    公开(公告)号:CN113808570B

    公开(公告)日:2023-07-14

    申请号:CN202111056323.9

    申请日:2021-09-09

    Abstract: 本发明公开了基于激活指导和内卷积的跨语种语音转换方法,包括训练阶段和转换阶段。本发明中提出的语音转换模型由编码器和解码器组成,首先在编解码器中采用内卷积代替传统卷积,极大地减少模型的参数量和计算量,有效地提升算法的运行效率;进一步利用编码器中的激活指导提取源说话人语句中的内容信息,同时采用U型连接将目标说话人的个性信息从编码器传递到解码器,并在解码器中与源说话人语句中的内容信息进行重构,从而实现高质量的跨语种语音转换。与此同时,该方法还可以对不在训练集内的说话人实现转换,即完成开集情形下任意说话人的跨语种转换。

    融合DSNet与EDSR网络的非平行多对多语音转换方法

    公开(公告)号:CN113643687A

    公开(公告)日:2021-11-12

    申请号:CN202110772028.7

    申请日:2021-07-08

    Abstract: 本发明公开了一种融合DSNet与EDSR网络的非平行多对多语音转换方法,本方法包括训练阶段和转换阶段,训练过程不需要任何对齐过程,能够实现非平行文本条件下的多对多语音转换。训练阶段包括以下步骤:获取训练语料,训练语料由8名说话人的语料组成,说话人包含源说话人和目标说话人;提取训练语料中的声学特征向量,将特征向量输入到转换网络中进行训练,转换网络包括生成器、鉴别器和分类器,生成器融合了DSNet与EDSR网络。本方法利用EDSR网络提升模型对语音频谱信息的提取能力,再通过DSNet网络将提取的频谱信息进行特征融合,从而较好地提升了转换语音的音质和个性相似度,实现高质量的多对多语音转换。

    融合DSNet与EDSR网络的非平行多对多语音转换方法

    公开(公告)号:CN113643687B

    公开(公告)日:2023-07-18

    申请号:CN202110772028.7

    申请日:2021-07-08

    Abstract: 本发明公开了一种融合DSNet与EDSR网络的非平行多对多语音转换方法,本方法包括训练阶段和转换阶段,训练过程不需要任何对齐过程,能够实现非平行文本条件下的多对多语音转换。训练阶段包括以下步骤:获取训练语料,训练语料由8名说话人的语料组成,说话人包含源说话人和目标说话人;提取训练语料中的声学特征向量,将特征向量输入到转换网络中进行训练,转换网络包括生成器、鉴别器和分类器,生成器融合了DSNet与EDSR网络。本方法利用EDSR网络提升模型对语音频谱信息的提取能力,再通过DSNet网络将提取的频谱信息进行特征融合,从而较好地提升了转换语音的音质和个性相似度,实现高质量的多对多语音转换。

    基于激活指导和内卷积的跨语种语音转换方法

    公开(公告)号:CN113808570A

    公开(公告)日:2021-12-17

    申请号:CN202111056323.9

    申请日:2021-09-09

    Abstract: 本发明公开了基于激活指导和内卷积的跨语种语音转换方法,包括训练阶段和转换阶段。本发明中提出的语音转换模型由编码器和解码器组成,首先在编解码器中采用内卷积代替传统卷积,极大地减少模型的参数量和计算量,有效地提升算法的运行效率;进一步利用编码器中的激活指导提取源说话人语句中的内容信息,同时采用U型连接将目标说话人的个性信息从编码器传递到解码器,并在解码器中与源说话人语句中的内容信息进行重构,从而实现高质量的跨语种语音转换。与此同时,该方法还可以对不在训练集内的说话人实现转换,即完成开集情形下任意说话人的跨语种转换。

Patent Agency Ranking