一种基于融合注意力机制的残差网络声源定位方法及系统

    公开(公告)号:CN119780836A

    公开(公告)日:2025-04-08

    申请号:CN202411806868.0

    申请日:2024-12-10

    Applicant: 南昌大学

    Abstract: 本发明公开了一种基于融合注意力机制的残差网络声源定位方法及系统,通过添加1×1的卷积核加入额外的SEAM模块形成SC‑SEAM模块,将SC‑SEAM模块加在残差网络结构的最后两个阶段,形成融合通道注意力机制模块的残差网络架构,训练生成室内声源定位模型,方法包括:在麦克风阵列获得一待定位声音信号后,将各路麦克风接收到的待定位声音信号进行STFT;提取各路麦克风接收到的待定位声音信号STFT系数之间的相位分量,求差得到各路麦克风之间的相位差图;将相位差图输入到室内声源定位模型,输出待定位声音信号的估计角度值。本发明在室内混响及噪声等多场景复杂环境下,声源位置定位准确率高,鲁棒性强。

Patent Agency Ranking