基于深度学习的语音增强
    1.
    发明公开

    公开(公告)号:CN119673191A

    公开(公告)日:2025-03-21

    申请号:CN202411887138.8

    申请日:2021-10-29

    Abstract: 本公开涉及基于深度学习的语音增强。公开了一种用于抑制噪声并增强语音的系统和相关方法。所述系统训练神经网络模型,所述神经网络模型获取与原始带噪声波形相对应的带能量并产生语音值,所述语音值指示每一帧处的每个频带中存在的语音量。所述神经模型包括实施某种前瞻的特征提取块。所述特征提取块之后是编码器,所述编码器沿频域进行稳定的下采样,从而形成收缩路径。所述编码器之后是对应的解码器,所述解码器沿频域进行稳定的上采样,从而形成扩大路径。所述解码器从对应级别的编码器接收经缩放的输出特征图。所述解码器之后是分类块,所述分类块生成语音值,所述语音值指示针对多个帧中的每一帧处的多个频带中的每个频带存在的语音量。

    使用神经网络处理音频的方法和装置

    公开(公告)号:CN116457797A

    公开(公告)日:2023-07-18

    申请号:CN202180076578.3

    申请日:2021-10-14

    Abstract: 本文描述了一种使用神经网络或者使用第一神经网络和第二神经网络处理音频信号的方法。进一步描述了一种训练所述神经网络或联合训练一组所述第一神经网络和所述第二神经网络的方法。此外,描述了一种使用神经网络获得和传输感知域音频信号的潜在特征空间表示的方法、以及一种使用神经网络从感知域音频信号的潜在特征空间表示获得音频信号的方法。还描述了相应的装置和计算机程序产品。

    基于深度学习的语音增强

    公开(公告)号:CN116508099B

    公开(公告)日:2025-01-10

    申请号:CN202180073792.3

    申请日:2021-10-29

    Abstract: 公开了一种用于抑制噪声并增强语音的系统和相关方法。所述系统训练神经网络模型,所述神经网络模型获取与原始带噪声波形相对应的带能量并产生语音值,所述语音值指示每一帧处的每个频带中存在的语音量。所述神经模型包括实施某种前瞻的特征提取块。所述特征提取块之后是编码器,所述编码器沿频域进行稳定的下采样,从而形成收缩路径。所述编码器之后是对应的解码器,所述解码器沿频域进行稳定的上采样,从而形成扩大路径。所述解码器从对应级别的编码器接收经缩放的输出特征图。所述解码器之后是分类块,所述分类块生成语音值,所述语音值指示针对所述多个帧中的每一帧处的所述多个频带中的每个频带存在的语音量。

    基于深度学习的语音增强

    公开(公告)号:CN116508099A

    公开(公告)日:2023-07-28

    申请号:CN202180073792.3

    申请日:2021-10-29

    Abstract: 公开了一种用于抑制噪声并增强语音的系统和相关方法。所述系统训练神经网络模型,所述神经网络模型获取与原始带噪声波形相对应的带能量并产生语音值,所述语音值指示每一帧处的每个频带中存在的语音量。所述神经模型包括实施某种前瞻的特征提取块。所述特征提取块之后是编码器,所述编码器沿频域进行稳定的下采样,从而形成收缩路径。所述编码器之后是对应的解码器,所述解码器沿频域进行稳定的上采样,从而形成扩大路径。所述解码器从对应级别的编码器接收经缩放的输出特征图。所述解码器之后是分类块,所述分类块生成语音值,所述语音值指示针对所述多个帧中的每一帧处的所述多个频带中的每个频带存在的语音量。

Patent Agency Ranking