-
公开(公告)号:CN118366469A
公开(公告)日:2024-07-19
申请号:CN202410425822.8
申请日:2024-04-10
Applicant: 杭州电子科技大学
IPC: G10L21/0208 , G10L21/0232 , G10L25/24 , G10L25/30
Abstract: 本发明公开了一种基于神经同态合成与相位估计的语音增强方法和系统,包括如下步骤:步骤S1:构建同态滤波模块,用于接收带噪语音信号并进行信号处理后输出带噪语音特征,其中,带噪语音特征至少包括相位信息、激励信息和声道信息;步骤S2:构建增强模块,用于接收带噪语音特征并进行信号处理后输出增强后的相位信息、激励信息和声道信息;步骤S3:构建后处理模块,对增强后的相位信息、激励信息、声道信息进行合成,输出增强后的语音信号。本发明实现一个神经网络同态滤波器,完成对激励和声道更加精确地分离;同时本发明对相位信息专门设置相位估计模块,利用复数频谱损失和抗卷绕损失增强相位恢复能力。
-
公开(公告)号:CN117894333A
公开(公告)日:2024-04-16
申请号:CN202410245935.X
申请日:2024-03-05
Applicant: 杭州电子科技大学
IPC: G10L21/0208 , G10L25/24 , G10L25/30 , G10L19/16
Abstract: 本发明公开了一种融合声码器和相位估计的语音增强方法和系统,至少包括如下步骤:步骤S1:构建、训练声码器增强单元,用于对输入的带噪语音进行处理,输出增强语音信息;步骤S2:构建、训练相位增强单元,用于对输入的带噪语音进行处理,输出增强相位信息;步骤S3:构建后处理模块,用于接收步骤S2获取的增强相位信息和步骤S1获取的增强语音信息并进行融合处理,以得到降噪后的语音信号。本发明采用融合声码器和相位估计的语音增强联合架构,提升了语音增强模型生成模型的质量;另外,采用的相位解码器和抗卷绕相位损失函数解决了相位处理的关键难题,有效提高了语音增强技术在低信噪比场景下的表现。
-