-
公开(公告)号:CN115128544A
公开(公告)日:2022-09-30
申请号:CN202210649704.6
申请日:2022-06-09
Applicant: 厦门亿联网络技术股份有限公司
IPC: G01S5/18
Abstract: 本发明公开了一种基于麦克风线性双阵列的声源定位方法、装置及介质,包括:设置第一麦克风阵列和第二麦克风阵列,以构成麦克风线性双阵列;其中,所述第一麦克风阵列和所述第二麦克风阵列的布局完全相同,且都由多个麦克风构成;所述第一麦克风阵列的中心和所述第二麦克风阵列的中心之间的距离不小于所述第一麦克风阵列中各所述麦克风之间的距离;获取各所述麦克风接收的原始声音数据,并根据所有所述原始声音数据,分析计算得到目标声源相对于所述麦克风线性双阵列的位置和垂直距离,作为所述目标声源的定位结果。本发明通过对麦克风线性双阵列中第一麦克风阵列和第二麦克风阵列的布局进行限制,避免麦克风间距过小影响远距离定位的效果。
-
公开(公告)号:CN111883153B
公开(公告)日:2024-02-23
申请号:CN202010600751.2
申请日:2020-06-28
Applicant: 厦门亿联网络技术股份有限公司
IPC: G10L21/0208 , G10L21/0216 , G10L21/0224 , G10L21/0232 , G10L25/27 , G10L25/45 , G10L25/60
Abstract: 本发明公开了一种基于麦克风阵列的双端讲话状态检测方法及装置,所述方法包括:通过麦克风采集不同通道对应的语音模拟信号,并将所述语音模拟信号转换为语音数字信号,得到第一通道信号和第二通道信号;采用NLMS算法对所述第一通道信号和所述第二通道信号进行线性回声消除处理;对所述第一通道信号和所述第二通道信号进行GCC运算,通过两个通道信号的广义互相关函数计算时延值后进行峰值检测,得到最大峰值;通过所述最大峰值和预设第一距离阈值进行比较,判断当前麦克风的双端讲话检测状态。本发明对于麦克风和扬声器相对位置固定的硬件终端能够有效判断出双端讲话状态,提高判断双端讲话状态的准确性和适应性。
-
公开(公告)号:CN111883153A
公开(公告)日:2020-11-03
申请号:CN202010600751.2
申请日:2020-06-28
Applicant: 厦门亿联网络技术股份有限公司
IPC: G10L21/0208 , G10L21/0216 , G10L21/0224 , G10L21/0232 , G10L25/27 , G10L25/45 , G10L25/60
Abstract: 本发明公开了一种基于麦克风阵列的双端讲话状态检测方法及装置,所述方法包括:通过麦克风采集不同通道对应的语音模拟信号,并将所述语音模拟信号转换为语音数字信号,得到第一通道信号和第二通道信号;采用NLMS算法对所述第一通道信号和所述第二通道信号进行线性回声消除处理;对所述第一通道信号和所述第二通道信号进行GCC运算,通过两个通道信号的广义互相关函数计算时延值后进行峰值检测,得到最大峰值;通过所述最大峰值和预设第一距离阈值进行比较,判断当前麦克风的双端讲话检测状态。本发明对于麦克风和扬声器相对位置固定的硬件终端能够有效判断出双端讲话状态,提高判断双端讲话状态的准确性和适应性。
-
公开(公告)号:CN112363112B
公开(公告)日:2024-04-09
申请号:CN202011093171.5
申请日:2020-10-13
Applicant: 厦门亿联网络技术股份有限公司
IPC: G01S5/18
Abstract: 本发明公开了一种基于线性麦克风阵列的声源定位方法及装置,所述方法包括:采用GCC‑PHAT方法对若干组麦克风组合分别进行声源角度计算,得出每帧每组麦克风组合的声源角度信息;将声源角度信息统一放置于预设的时间窗内进行统计,根据预设的统计算法计算出初步声源角度;在判断当前场景需要过滤噪声信息后,对初步声源角度进行噪声信息过滤,得到最终的声源定位结果。本发明通过利用麦克风多通道的信息进行声源角度信息的计算,提升声源定位鲁棒性,优化在实际的视频会议场景中由于噪声和混响的存在而导致声源定位效果不佳的问题,提高音质体验,给出稳定的主讲人的定位角度,从而指导在视频会议中对主讲人进行搜索和定位,实现主讲人特写的效果。
-
公开(公告)号:CN112363112A
公开(公告)日:2021-02-12
申请号:CN202011093171.5
申请日:2020-10-13
Applicant: 厦门亿联网络技术股份有限公司
IPC: G01S5/18
Abstract: 本发明公开了一种基于线性麦克风阵列的声源定位方法及装置,所述方法包括:采用GCC‑PHAT方法对若干组麦克风组合分别进行声源角度计算,得出每帧每组麦克风组合的声源角度信息;将声源角度信息统一放置于预设的时间窗内进行统计,根据预设的统计算法计算出初步声源角度;在判断当前场景需要过滤噪声信息后,对初步声源角度进行噪声信息过滤,得到最终的声源定位结果。本发明通过利用麦克风多通道的信息进行声源角度信息的计算,提升声源定位鲁棒性,优化在实际的视频会议场景中由于噪声和混响的存在而导致声源定位效果不佳的问题,提高音质体验,给出稳定的主讲人的定位角度,从而指导在视频会议中对主讲人进行搜索和定位,实现主讲人特写的效果。
-
-
-
-