一种基于神经网络的声源定位方法

    公开(公告)号:CN108318862B

    公开(公告)日:2021-08-20

    申请号:CN201711428934.5

    申请日:2017-12-26

    Applicant: 北京大学

    Abstract: 本发明公开了一种基于神经网络的声源定位方法。本发明对所有传输路径的传递函数,即传递特性进行建模,通过深度学习的方式从大量数据中学习到声音信号在传播过程中由于散射体的存在或环境等原因造成的相位和幅度变化规律,通过神经网络可以恢复到原始的相位和幅度,最后结合时间差和幅度差两个定位线索进行声源定位。本发明利用了已知的时延信息,再利用深度神经网络恢复原始的相位和幅度,并有效地结合了时间信息和幅度信息进行定位,显著提高了抗噪性能。

    一种基于多任务学习的端到端声源定位方法及系统

    公开(公告)号:CN109782231A

    公开(公告)日:2019-05-21

    申请号:CN201910043338.8

    申请日:2019-01-17

    Applicant: 北京大学

    Abstract: 本发明公开了一种基于多任务学习的端到端声源定位方法及系统。本方法为:1)对于待扫描的每个声源位置,计算声音信号从该声源位置传输到各麦克风位置的延时;2)根据时延对该麦克风阵列每次扫描时各麦克风所采集的多通道帧级别的时域信号进行相应延时补偿;3)将每一延时补偿后的时域信号输入到一对应的CNN模型进行特征提取并输入到一深度神经网络;4)该深度神经网络根据各CNN模型提取的特征估计出每一扫描位置的多通道声源信号;5)对于每一扫描位置,计算该扫描位置对应的多通道声源信号的互相关系数和,选取相关系数和最大的位置作为声源位置。本发明能够自行提取合适的特征,并引入多任务学习机制,提高模型的定位性能。

    一种基于多任务学习的端到端声源定位方法及系统

    公开(公告)号:CN109782231B

    公开(公告)日:2020-11-20

    申请号:CN201910043338.8

    申请日:2019-01-17

    Applicant: 北京大学

    Abstract: 本发明公开了一种基于多任务学习的端到端声源定位方法及系统。本方法为:1)对于待扫描的每个声源位置,计算声音信号从该声源位置传输到各麦克风位置的延时;2)根据时延对该麦克风阵列每次扫描时各麦克风所采集的多通道帧级别的时域信号进行相应延时补偿;3)将每一延时补偿后的时域信号输入到一对应的CNN模型进行特征提取并输入到一深度神经网络;4)该深度神经网络根据各CNN模型提取的特征估计出每一扫描位置的多通道声源信号;5)对于每一扫描位置,计算该扫描位置对应的多通道声源信号的互相关系数和,选取相关系数和最大的位置作为声源位置。本发明能够自行提取合适的特征,并引入多任务学习机制,提高模型的定位性能。

    一种基于神经网络的声源定位方法

    公开(公告)号:CN108318862A

    公开(公告)日:2018-07-24

    申请号:CN201711428934.5

    申请日:2017-12-26

    Applicant: 北京大学

    CPC classification number: G01S5/22

    Abstract: 本发明公开了一种基于神经网络的声源定位方法。本发明对所有传输路径的传递函数,即传递特性进行建模,通过深度学习的方式从大量数据中学习到声音信号在传播过程中由于散射体的存在或环境等原因造成的相位和幅度变化规律,通过神经网络可以恢复到原始的相位和幅度,最后结合时间差和幅度差两个定位线索进行声源定位。本发明利用了已知的时延信息,再利用深度神经网络恢复原始的相位和幅度,并有效地结合了时间信息和幅度信息进行定位,显著提高了抗噪性能。

Patent Agency Ranking