基于双路径一维卷积分组循环网络的轻量化语音增强方法

    公开(公告)号:CN119851680A

    公开(公告)日:2025-04-18

    申请号:CN202510001132.4

    申请日:2025-01-02

    Abstract: 本发明属于语音增强技术领域,具体是一种基于双路径一维卷积分组循环网络的轻量化语音增强方法。首先,获取含噪语音信号,并提取含噪语音信号的频谱特征;然后,构建双路径一维卷积分组循环网络模型,包括编码器模块、解码器模块和位于编码器模块与解码器模块之间的双路径分组循环模块,将解码器模块的输出特征与编码器模块的输入特征进行复数乘法,得到估计的复数比率掩码;最后,提取待增强的含噪语音信号的频谱特征,将待增强的含噪语音信号的频谱特征输入到训练后的模型中,得到估计的复数比率掩码;将待增强的含噪语音信号的频谱特征与估计的复数比率掩码进行复数乘法,得到增强语音信号的频谱特征;将增强语音信号的频谱特征依次经过逆短时傅里叶变换和重叠相加,得到增强语音信号。该方法减少了模型参数量与计算量,解决了现有语音增强技术实时处理性能不足,计算资源需求大,不适合在边缘设备上部署的问题。

Patent Agency Ranking