-
公开(公告)号:CN110646763A
公开(公告)日:2020-01-03
申请号:CN201910957856.0
申请日:2019-10-10
Applicant: 出门问问信息科技有限公司
Abstract: 本发明公开了一种基于语义的声源定位方法、装置及存储介质。基于语义的声源定位方法包括:首先,利用波束成形技术对N个方向的音频信号进行增强,分别得到相应的N个增强音频结果,其中,N的取值为大于1的正整数;接下来,对N个增强音频结果分别与目标语义进行对比,得到相应的N个匹配度数值;然后,从N个匹配度数值中选取匹配度数值最高的音频信号为目标音频信号;之后,将目标音频信号所在方向确定为定位方向。可以看出,本发明实施例在波达方向估计(DOA)基础上,利用波束成形技术获得定向的增强音频信号,并加入了语义相关性的考虑,可以从声频特征类似的多个声源中定位目标声源,去除噪音影响,大大提高了抗干扰能力。