-
公开(公告)号:CN107358966A
公开(公告)日:2017-11-17
申请号:CN201710498188.0
申请日:2017-06-27
Applicant: 北京理工大学
Abstract: 本发明公开了基于深度学习语音增强的无参考语音质量客观评估方法,属于语音质量评价技术领域。本方法分为三个步骤:首先将待测语音经过已经训练好的基于深度信念网络的语音增强模型,得到增强后的语音信号;然后,分别提取出增强前后信号的梅尔倒谱系数,做两个系数的差;最后将这个参数作为输入,通过第二层的BP神经网络模型,映射为最终的客观分数,由此实现无参考的语音质量客观评价。与以往的无参考语音质量评价模型相比,本发明方法与主观质量评分的相关度更好,均方误差也更小。
-
公开(公告)号:CN107358966B
公开(公告)日:2020-05-12
申请号:CN201710498188.0
申请日:2017-06-27
Applicant: 北京理工大学
Abstract: 本发明公开了基于深度学习语音增强的无参考语音质量客观评估方法,属于语音质量评价技术领域。本方法分为三个步骤:首先将待测语音经过已经训练好的基于深度信念网络的语音增强模型,得到增强后的语音信号;然后,分别提取出增强前后信号的梅尔倒谱系数,做两个系数的差;最后将这个参数作为输入,通过第二层的BP神经网络模型,映射为最终的客观分数,由此实现无参考的语音质量客观评价。与以往的无参考语音质量评价模型相比,本发明方法与主观质量评分的相关度更好,均方误差也更小。
-
公开(公告)号:CN106981292B
公开(公告)日:2020-04-14
申请号:CN201710342387.2
申请日:2017-05-16
Applicant: 北京理工大学
IPC: G10L19/008
Abstract: 本发明公开了一种基于张量建模的多路空间音频信号压缩和恢复方法,属于音频信号处理技术领域,尤其是空间音频编解码技术领域。对于多路空间音频信号进行声道能量归一化,同时获得声道能量调整参数,对每个声道的音频信号进行分帧、时频变换得到频域上的特征参数。对于训练样本集,建立四阶音频张量,经过张量分解得到三个低秩因子矩阵,其与测试样本集构建的三阶音频张量进行张量运算,得到压缩的核张量与声道能量调整参数一起编码传输,在解码端传输而来的核张量与训练好的低秩因子矩阵进行张量重构,对重构的张量信号在每个声道上进行逆变换、重叠相加和能量调整恢复出多路空间音频信号。本方法采用独特的因子矩阵的训练模式对多路空间音频信号进行张量建模能达到更高的压缩效率。
-
公开(公告)号:CN106981292A
公开(公告)日:2017-07-25
申请号:CN201710342387.2
申请日:2017-05-16
Applicant: 北京理工大学
IPC: G10L19/008
Abstract: 本发明公开了一种基于张量建模的多路空间音频信号压缩和恢复方法,属于音频信号处理技术领域,尤其是空间音频编解码技术领域。对于多路空间音频信号进行声道能量归一化,同时获得声道能量调整参数,对每个声道的音频信号进行分帧、时频变换得到频域上的特征参数。对于训练样本集,建立四阶音频张量,经过张量分解得到三个低秩因子矩阵,其与测试样本集构建的三阶音频张量进行张量运算,得到压缩的核张量与声道能量调整参数一起编码传输,在解码端传输而来的核张量与训练好的低秩因子矩阵进行张量重构,对重构的张量信号在每个声道上进行逆变换、重叠相加和能量调整恢复出多路空间音频信号。本方法采用独特的因子矩阵的训练模式对多路空间音频信号进行张量建模能达到更高的压缩效率。
-
-
-