一种适用于语音增强的轻量级神经网络系统及其方法

    公开(公告)号:CN118230747A

    公开(公告)日:2024-06-21

    申请号:CN202410198267.X

    申请日:2024-02-22

    Abstract: 本发明公开了一种适用于语音增强的轻量级神经网络系统及其方法。其系统包括编码器、增强器和解码器,编码器包括:频谱压缩模块,用于对含噪语音频谱在频率维度进行压缩;卷积模块,用于对频谱压缩模块压缩后的特征图做特征提取和频率维度的降采样;分组膨胀卷积模块,用于对卷积模块输出的特征图做进一步特征提取和频率维度的降采样,然后将特征图送入增强器;解码器包括:分组膨胀反卷积模块,用于对经增强器增强后的特征图做特征重建和频率维度的升采样;反卷积模块,用于对特征图做进一步的特征重建和频率维度的升采样;频谱扩张模块,用于对特征图的频率维度进行扩张。本发明可以以较低的参数量和计算量开销实现较高性能的语音增强。

    一种音频处理方法及装置
    3.
    发明公开

    公开(公告)号:CN115866482A

    公开(公告)日:2023-03-28

    申请号:CN202211176938.X

    申请日:2022-09-26

    Abstract: 公开了一种音频处理方法及装置,该方法可以获取待处理音频信号,确定主链信号及侧链信号。将侧链信号输入谐波生成器,分别生成奇次谐波信号和偶次谐波信号。确定奇次谐波信号的增益和偶次谐波信号的增益,得到增益后的奇次谐波信号和偶次谐波信号。混合增益后的奇次谐波信号和偶次谐波信号及主链信号,得到音频输出信号。本公开提供的方法可以通过产生奇次谐波信号和偶次谐波信号来改变待处理音频信号的非线性特性,还可以通过确定谐波信号的增益控制奇次谐波信号和偶次谐波信号的比例,能够实现对谐波结构的精确调整,进而实现对待处理音频信号的精细调整,可以提升待处理音频信号的清晰度、明亮度和可懂度。

    用于非线性声学回声消除的半盲源分离方法

    公开(公告)号:CN115294996A

    公开(公告)日:2022-11-04

    申请号:CN202210684642.2

    申请日:2022-06-17

    Abstract: 本发明公开了一种用于非线性声学回声消除的半盲源分离方法。包括如下步骤:(1)获取待处理的含有非线性回声的麦克风信号;(2)对非线性映射输入信号进行基函数展开,并利用基于卷积传递函数近似的短时傅里叶变换得到时频域观测模型,得到用于非线性声学回声消除的半盲源分离模型;(3)根据所述半盲源分离模型,基于辅助函数独立向量分析方法或者独立低秩矩阵分析方法实现信号的半盲源分离,优化分离矩阵并分离出近端时频域信号;(4)通过短时傅里叶逆变换得到时域近端信号。本发明的方法具有有效的非线性回声消除性能。

Patent Agency Ranking