一种平衡降噪量和语音音质的单通道语音增强方法

    公开(公告)号:CN116913308A

    公开(公告)日:2023-10-20

    申请号:CN202310707811.4

    申请日:2023-06-15

    Applicant: 南京大学

    Abstract: 本发明公开了一种平衡降噪量和语音音质的单通道语音增强方法。该方法步骤如下:(1)将含噪信号变换到时频域,并利用PEFAC方法估计基频;(2)计算后验信噪比,根据基频估计在倒谱域对其平滑,进而利用固定先验的方法估计后验语音存在概率;(3)根据后验语音存在概率估计噪声功率谱密度;(4)更新后验信噪比,计算语音功率谱密度的最大似然估计;(5)根据基频估计在倒谱域平滑语音功率谱密度,并增强基频,得到先验信噪比的估计;(6)利用自适应先验的方法再次估计后验语音存在概率;(7)计算基于广义伽马先验的对数谱幅度增益,并结合后验语音存在概率导出基于语音存在不确定性的增益估计;(8)增强语谱并变换回时域,得到增强信号。

    基于自适应卷积的超轻量级语音增强神经网络系统及方法

    公开(公告)号:CN119673188A

    公开(公告)日:2025-03-21

    申请号:CN202411891387.4

    申请日:2024-12-20

    Abstract: 本发明公开了一种基于自适应卷积的超轻量级语音增强神经网络系统及方法。其系统包括编码器:频谱压缩模块,用于对含噪语音频谱进行动态范围和频率维度的压缩;自适应卷积注意力模块,用于通过自适应卷积层和时间通道注意力对压缩后的特征图做频率维度的降采样和特征的提取分析,然后将特征图送入增强器;增强器:双路径分组循环神经网络,用于对语音的子带时间特征和帧内频率特征进行建模;解码器:自适应转置卷积注意力模块,用于对增强器输出的特征图做频率维度的升采样和特征重建;频谱扩张模块,用于对自适应转置卷积注意力模块输出的特征图的频率维度进行扩张。本发明可以以极低的计算复杂度实现较高性能的语音增强。

Patent Agency Ranking