-
公开(公告)号:CN108154885A
公开(公告)日:2018-06-12
申请号:CN201711353578.5
申请日:2017-12-15
Applicant: 重庆邮电大学
IPC: G10L21/0208 , G10L21/0224 , G10L21/0232 , G10L21/0308 , G10L25/21 , G10L25/27
Abstract: 本发明涉及一种使用QR-RLS算法对多通道语音信号去混响方法,属于信号处理技术领域。该方法将采集得到的带混响语音信号进行短时傅里叶变换,并在频域对输入信号进行延迟处理,通过混响时间T60计算混响语音信号的衰减常数Δ,从而估计出晚期混响信号和期望信号的功率谱密度;然后根据得到的期望信号功率谱密度的估计值计算期望信号2范数的加权系数;最后将延迟信号和带混响语音信号作为QR-RLS算法的输入数据,对其进行迭代更新,最后输出预测滤波器系数。本发明有效避免了当输入信号不具有一致性激励性时,自相关矩阵及其对应的求逆问题是病态的问题;使在病态环境下可以很容易的随时检查变换信息矩阵的正定性,从而有效提升了去混响系统中自适应模块的稳定性。
-
公开(公告)号:CN108133702A
公开(公告)日:2018-06-08
申请号:CN201711384226.6
申请日:2017-12-20
Applicant: 重庆邮电大学
Abstract: 本发明涉及一种基于MEE优化准则的深度神经网络语音增强模型,属于人工智能语音增强领域。该模型包括输入层、隐层和输出层,整个训练模型分为训练阶段和增强阶段。所述训练阶段,将纯净语音和多种类噪声两两相加构建不同信噪比下的混合带噪语音;对混合语音进行特征提取,输入到DNN网络进行训练。所述增强阶段,对待测混合语音进行相同特征提取,输入到已经训练好的DNN网络进行解码,网络输出对纯净语音的特征的估计,再进行波形重构,得到降噪后的语音文件。本发明对实际问题中含非平稳噪声的带噪语音降噪具有较好的普适性。
-