-
公开(公告)号:CN119517057A
公开(公告)日:2025-02-25
申请号:CN202411614285.8
申请日:2024-11-13
Applicant: 南京邮电大学
IPC: G10L21/02 , G10L21/0216 , G10L21/0224 , G10L21/0232 , G10L25/30 , G06N3/0464 , G06N3/0455
Abstract: 本发明公开一种语音信号处理技术领域的基于时频图卷积网络的语音增强方法及系统,方法包括:获取待增强的含噪语音数据,输入改进后的度量生成对抗网络CMGAN,输出增强语音时域信号;其中,所述度量生成对抗网络CMGAN的改进方法包括:将度量生成对抗网络CMGAN的编码器模块替换为时频图卷积编码器模块;在所述时频图卷积编码器模块中,利用时间卷积网络和图卷积网络分别提取待增强的含噪语音数据的长时间依赖关系和全局频率特征信息,同时引入稠密残差连接融合多尺度特征信息。实现了在较少模型参数量和计算量的情况下提高语音增强的性能。