一种基于融合注意力机制的残差网络声源定位方法及系统

    公开(公告)号:CN119780836A

    公开(公告)日:2025-04-08

    申请号:CN202411806868.0

    申请日:2024-12-10

    Applicant: 南昌大学

    Abstract: 本发明公开了一种基于融合注意力机制的残差网络声源定位方法及系统,通过添加1×1的卷积核加入额外的SEAM模块形成SC‑SEAM模块,将SC‑SEAM模块加在残差网络结构的最后两个阶段,形成融合通道注意力机制模块的残差网络架构,训练生成室内声源定位模型,方法包括:在麦克风阵列获得一待定位声音信号后,将各路麦克风接收到的待定位声音信号进行STFT;提取各路麦克风接收到的待定位声音信号STFT系数之间的相位分量,求差得到各路麦克风之间的相位差图;将相位差图输入到室内声源定位模型,输出待定位声音信号的估计角度值。本发明在室内混响及噪声等多场景复杂环境下,声源位置定位准确率高,鲁棒性强。

    一种驾驶场景风险评估方法及系统

    公开(公告)号:CN120069569A

    公开(公告)日:2025-05-30

    申请号:CN202510563018.0

    申请日:2025-04-30

    Applicant: 南昌大学

    Abstract: 本发明提供了一种驾驶场景风险评估方法及系统,方法包括:通过图像特征提取模块对输入的原始图像进行特征提取,并通过3D点云特征提取模块对输入的3D点云进行特征提取,以分别生成对应的图像特征以及3D点云特征;基于交叉注意力算法通过特征融合模块对图像特征以及3D点云特征进行特征融合处理,并通过中心向量约束模块对来自不同域的特征在特征空间中服从近似相同的分布,以对应生成若干不同类别的样本;在风险等级评估模块中添加附件角度余量惩罚,以使若干不同类别的样本之间形成对应的角度间隔,并根据角度间隔的大小评估出对应的风险等级。本发明能够客观、准确的评估出对应的驾驶场景风险等级,对应提升了用户的使用体验。

Patent Agency Ranking