基于变分自编码网络双向化损失函数的语音转换方法

    公开(公告)号:CN116312582A

    公开(公告)日:2023-06-23

    申请号:CN202310167537.6

    申请日:2023-02-27

    Abstract: 本发明公开了一种基于变分自编码网络双向化损失函数的语音转换方法,过程如下:选取并划分语音数据;从各个语音样本提取声学特征;构建文本编码器、说话人编码器与解码器:将语音输入文本编码器和说话人编码器,分别提取文本信息和说话人信息,再通过解码器得到重构语音;构造双向化损失函数并训练网络,使得相同说话人的不同语音样本的说话人发音特性信息一致且提取的文本信息的散度值尽可能小;采用语音测试集评测此变分自编码网络的语音转换性能。本发明通过构造文本编码器和说话人编码器,分离说话人发音特性信息和文本信息,实现一次性语音转换。采用双向化损失函数训练变分自编码网络,在不增加算法复杂度的前提下提高语音转换性能。

Patent Agency Ranking