-
公开(公告)号:CN113450769A
公开(公告)日:2021-09-28
申请号:CN202010158648.7
申请日:2020-03-09
Applicant: 杭州海康威视数字技术股份有限公司
Inventor: 童仁杰
IPC: G10L15/02 , G10L15/24 , G10L21/0216
Abstract: 本发明提供一种语音提取方法、装置、设备和存储介质。该方法包括:获取目标声源处的图像;根据所述目标声源在所述图像中的像素位置,确定所述目标声源的波达方向DOA;根据所述DOA,以及预设的N个波束的输出信号,提取目标声源的语音输出信号;所述N个波束是以麦克风阵列为基准而预设的具有不同指向的各个波束,N≥2。本发明实施例在语音信号的信噪比较低的情况下,特别是远距离悄悄话的情景下,根据目标声源处的图像的信息,确定目标声源的波达方向DOA,可以提高DOA估计的准确性,进而能够提高提取的语音信号的质量。
-
公开(公告)号:CN113450769B
公开(公告)日:2024-06-25
申请号:CN202010158648.7
申请日:2020-03-09
Applicant: 杭州海康威视数字技术股份有限公司
Inventor: 童仁杰
IPC: G10L15/02 , G10L15/24 , G10L21/0216
Abstract: 本发明提供一种语音提取方法、装置、设备和存储介质。该方法包括:获取目标声源处的图像;根据所述目标声源在所述图像中的像素位置,确定所述目标声源的波达方向DOA;根据所述DOA,以及预设的N个波束的输出信号,提取目标声源的语音输出信号;所述N个波束是以麦克风阵列为基准而预设的具有不同指向的各个波束,N≥2。本发明实施例在语音信号的信噪比较低的情况下,特别是远距离悄悄话的情景下,根据目标声源处的图像的信息,确定目标声源的波达方向DOA,可以提高DOA估计的准确性,进而能够提高提取的语音信号的质量。
-
公开(公告)号:CN112911465A
公开(公告)日:2021-06-04
申请号:CN202110138609.5
申请日:2021-02-01
Applicant: 杭州海康威视数字技术股份有限公司
Abstract: 本发明实施例提供了信号发送方法、装置及电子设备,该方法包括:获取语音信号,其中,语音信号是针对交互现场进行语音采集的麦克风阵列所采集的;基于预设的波束形成算法,对所获取的语音信号进行波束生成,得到多个波束方向不同的语音波束;获取远端音源信息,其中,远端音源信息用于指示交互现场中远端音源相对麦克风阵列的方向;从多个语音波束中,确定波束方向与远端音源信息所指示方向不同的语音波束,作为可用波束。通过本方案,可以提高语音交互系统的互动质量。
-
公开(公告)号:CN112911465B
公开(公告)日:2022-09-02
申请号:CN202110138609.5
申请日:2021-02-01
Applicant: 杭州海康威视数字技术股份有限公司
Abstract: 本发明实施例提供了信号发送方法、装置及电子设备,该方法包括:获取语音信号,其中,语音信号是针对交互现场进行语音采集的麦克风阵列所采集的;基于预设的波束形成算法,对所获取的语音信号进行波束生成,得到多个波束方向不同的语音波束;获取远端音源信息,其中,远端音源信息用于指示交互现场中远端音源相对麦克风阵列的方向;从多个语音波束中,确定波束方向与远端音源信息所指示方向不同的语音波束,作为可用波束。通过本方案,可以提高语音交互系统的互动质量。
-
-
-