-
公开(公告)号:CN109346063B
公开(公告)日:2022-10-14
申请号:CN201811188759.1
申请日:2018-10-12
Applicant: 电子科技大学
Abstract: 本发明公开了一种语音数据增强方法,具体属于机器学习处理时的语音数据增强技术领域。本发明通过训练集中的语音数据的语谱图训练多个自动编码器,使用待增强的语音数据集的语谱图形式对自动编码器进行分别训练,从而获得N个基于待增强语音数据的自动编码器,利用这些不同结构下的自动编码器对原始数据的编码表达,从而实现以待增强的语音数据语谱图进行输入后获得多组结构差异化的输出语谱图结构,最后通过对这些语谱图结构进行融合合并,得到一个新产生可用以训练的语音语谱图数据,其与输入前数据在主体结构上保持了一定一致性,但是在一些结构特征上却有着较为不一致的表达。从而提高基于语音数据的机器学习模型性能。
-
公开(公告)号:CN109346063A
公开(公告)日:2019-02-15
申请号:CN201811188759.1
申请日:2018-10-12
Applicant: 电子科技大学
Abstract: 本发明公开了一种语音数据增强方法,具体属于机器学习处理时的语音数据增强技术领域。本发明通过训练集中的语音数据的语谱图训练多个自动编码器,使用待增强的语音数据集的语谱图形式对自动编码器进行分别训练,从而获得N个基于待增强语音数据的自动编码器,利用这些不同结构下的自动编码器对原始数据的编码表达,从而实现以待增强的语音数据语谱图进行输入后获得多组结构差异化的输出语谱图结构,最后通过对这些语谱图结构进行融合合并,得到一个新产生可用以训练的语音语谱图数据,其与输入前数据在主体结构上保持了一定一致性,但是在一些结构特征上却有着较为不一致的表达。从而提高基于语音数据的机器学习模型性能。
-