-
公开(公告)号:CN104217721B
公开(公告)日:2017-03-08
申请号:CN201410399475.2
申请日:2014-08-14
Applicant: 东南大学
Abstract: 本发明提出了一种基于说话人模型对齐的非对称语音库条件下的语音转换方法,首先由源说话人和目标说话人的频谱特征分别训练得到各自的说话人模型,然后利用说话人模型中的参数找到源说话人特征向量和辅助向量之间的转换函数、辅助向量和目标说话人特征向量之间的转换函数,最后利用这两个转换函数求得源说话人和目标说话人之间的转换函数;在语音转换的过程中,使用了说话人模型对齐的方法,并且为了进一步提升语音转换的效果,还采用了将说话人模型对齐与高斯混合模型相融合的方法。实验结果表明:本发明在频谱失真度和相关度、转换语音的质量和相似度上,都取得了比传统基于INCA的语音转换方法更好的效果。
-
公开(公告)号:CN104217721A
公开(公告)日:2014-12-17
申请号:CN201410399475.2
申请日:2014-08-14
Applicant: 东南大学
Abstract: 本发明提出了一种基于说话人模型对齐的非对称语音库条件下的语音转换方法,首先由源说话人和目标说话人的频谱特征分别训练得到各自的说话人模型,然后利用说话人模型中的参数找到源说话人特征向量和辅助向量之间的转换函数、辅助向量和目标说话人特征向量之间的转换函数,最后利用这两个转换函数求得源说话人和目标说话人之间的转换函数;在语音转换的过程中,使用了说话人模型对齐的方法,并且为了进一步提升语音转换的效果,还采用了将说话人模型对齐与高斯混合模型相融合的方法。实验结果表明:本发明在频谱失真度和相关度、转换语音的质量和相似度上,都取得了比传统基于INCA的语音转换方法更好的效果。
-
公开(公告)号:CN102737643A
公开(公告)日:2012-10-17
申请号:CN201110092780.3
申请日:2011-04-14
Applicant: 东南大学
IPC: G10L21/02
Abstract: 本发明提供一种基于Gabor时频分析的耳语增强方法,包括如下步骤:第1步:利用Gabor时频分析理论和方法提取耳语音对数谱幅度,第2步,基于无语音概率的耳语音噪声谱估计,第3步,获取纯净耳语音的功率谱,并求增强后的耳语音信号;本发明基于Gabor变换下的耳语音功率谱根据抽样率的不同有着多样的时频分析细腻度,从而可以根据不同的语音类型采用不同的抽样率,使算法普适性更强。
-
-