-
公开(公告)号:CN119296566B
公开(公告)日:2025-05-16
申请号:CN202411845049.7
申请日:2024-12-16
Applicant: 南京邮电大学
IPC: G10L21/0232 , G10L21/0264 , G10L19/02 , G10L19/16 , G06N3/0455 , G06N3/0464 , G06N3/048 , G06N3/08 , G06N3/0475 , G06N3/094
Abstract: 本发明公开了语音信号传输处理技术领域的一种基于语义通信的远程语音增强传输方法及系统,系统包括:本地发送端,用于:对待增强的含噪语音信号进行短时傅里叶变换后,利用语义编码器对含噪语音信号频谱进行语义特征提取;然后利用信道编码器对语音语义特征进行维度调整;最后通过信道传输至远程接收端;远程接收端,用于:接收通过信道传输过来的语音语义特征信号;利用信道解码器对接收到的语音语义特征信号进行维度恢复后,利用语义解码器进行语义解码得到预测纯净语音信号的实部与虚部,最后进行逆短时傅里叶变换得到重构语音信号。本发明可以在节约通信资源的情况下,显著提高远程接收端在低信噪比信道传输条件下恢复的纯净语音质量。
-
公开(公告)号:CN119517057A
公开(公告)日:2025-02-25
申请号:CN202411614285.8
申请日:2024-11-13
Applicant: 南京邮电大学
IPC: G10L21/02 , G10L21/0216 , G10L21/0224 , G10L21/0232 , G10L25/30 , G06N3/0464 , G06N3/0455
Abstract: 本发明公开一种语音信号处理技术领域的基于时频图卷积网络的语音增强方法及系统,方法包括:获取待增强的含噪语音数据,输入改进后的度量生成对抗网络CMGAN,输出增强语音时域信号;其中,所述度量生成对抗网络CMGAN的改进方法包括:将度量生成对抗网络CMGAN的编码器模块替换为时频图卷积编码器模块;在所述时频图卷积编码器模块中,利用时间卷积网络和图卷积网络分别提取待增强的含噪语音数据的长时间依赖关系和全局频率特征信息,同时引入稠密残差连接融合多尺度特征信息。实现了在较少模型参数量和计算量的情况下提高语音增强的性能。
-
公开(公告)号:CN119296566A
公开(公告)日:2025-01-10
申请号:CN202411845049.7
申请日:2024-12-16
Applicant: 南京邮电大学
IPC: G10L21/0232 , G10L21/0264 , G10L19/02 , G10L19/16 , G06N3/0455 , G06N3/0464 , G06N3/048 , G06N3/08 , G06N3/0475 , G06N3/094
Abstract: 本发明公开了语音信号传输处理技术领域的一种基于语义通信的远程语音增强传输方法及系统,系统包括:本地发送端,用于:对待增强的含噪语音信号进行短时傅里叶变换后,利用语义编码器对含噪语音信号频谱进行语义特征提取;然后利用信道编码器对语音语义特征进行维度调整;最后通过信道传输至远程接收端;远程接收端,用于:接收通过信道传输过来的语音语义特征信号;利用信道解码器对接收到的语音语义特征信号进行维度恢复后,利用语义解码器进行语义解码得到预测纯净语音信号的实部与虚部,最后进行逆短时傅里叶变换得到重构语音信号。本发明可以在节约通信资源的情况下,显著提高远程接收端在低信噪比信道传输条件下恢复的纯净语音质量。
-
-