基于多尺度空间信息与频谱特征融合的多通道语音增强方法

    公开(公告)号:CN119889338A

    公开(公告)日:2025-04-25

    申请号:CN202411912274.8

    申请日:2024-12-24

    Applicant: 东南大学

    Abstract: 本发明公开了基于多尺度空间信息与频谱特征融合的多通道语音增强方法,根据频谱特性将不同频谱成分重新组合,提取通道内、通道间以及全通道的特征模式;并对上述特征进行融合,创建统一深度特征;引入局部特征提取模块增强当前帧特征权重并通过特征注意力机制融合不同尺度下的特征;引入分解注意力机制,在多个分解空间融合编码器和解码器输出,让细节特征也能被深度模块使用。本发明将空间特征和频谱特征相结合,利用特征融合方法创建统一的特征表达。通过注意力模块自适应学习空间特征中所包含的模式并加以利用,而非拟合具有物理含义的方向性特征,能够更灵活地适应不同的场景,具有良好的应用前景。

Patent Agency Ranking