Patent search ap:("杭州海康威视数字技术股份有限公司") AND inv:"童仁杰" Page 1

1.

发明公开
语音提取方法、装置、设备和存储介质有权

公开(公告)号：CN113450769A

公开(公告)日：2021-09-28

申请号：CN202010158648.7

申请日：2020-03-09

Applicant: 杭州海康威视数字技术股份有限公司

Inventor： 童仁杰

IPC: G10L15/02 , G10L15/24 , G10L21/0216

Abstract: 本发明提供一种语音提取方法、装置、设备和存储介质。该方法包括：获取目标声源处的图像；根据所述目标声源在所述图像中的像素位置，确定所述目标声源的波达方向DOA；根据所述DOA，以及预设的N个波束的输出信号，提取目标声源的语音输出信号；所述N个波束是以麦克风阵列为基准而预设的具有不同指向的各个波束，N≥2。本发明实施例在语音信号的信噪比较低的情况下，特别是远距离悄悄话的情景下，根据目标声源处的图像的信息，确定目标声源的波达方向DOA，可以提高DOA估计的准确性，进而能够提高提取的语音信号的质量。

2.

发明授权
语音提取方法、装置、设备和存储介质有权

公开(公告)号：CN113450769B

公开(公告)日：2024-06-25

申请号：CN202010158648.7

申请日：2020-03-09

Applicant: 杭州海康威视数字技术股份有限公司

Inventor： 童仁杰

IPC: G10L15/02 , G10L15/24 , G10L21/0216

Abstract: 本发明提供一种语音提取方法、装置、设备和存储介质。该方法包括：获取目标声源处的图像；根据所述目标声源在所述图像中的像素位置，确定所述目标声源的波达方向DOA；根据所述DOA，以及预设的N个波束的输出信号，提取目标声源的语音输出信号；所述N个波束是以麦克风阵列为基准而预设的具有不同指向的各个波束，N≥2。本发明实施例在语音信号的信噪比较低的情况下，特别是远距离悄悄话的情景下，根据目标声源处的图像的信息，确定目标声源的波达方向DOA，可以提高DOA估计的准确性，进而能够提高提取的语音信号的质量。

3.

发明公开
信号发送方法、装置及电子设备有权

公开(公告)号：CN112911465A

公开(公告)日：2021-06-04

申请号：CN202110138609.5

申请日：2021-02-01

Applicant: 杭州海康威视数字技术股份有限公司

Inventor： 陈扬坤 , 童仁杰 , 杨茜

IPC: H04R1/40 , H04R3/02

Abstract: 本发明实施例提供了信号发送方法、装置及电子设备，该方法包括：获取语音信号，其中，语音信号是针对交互现场进行语音采集的麦克风阵列所采集的；基于预设的波束形成算法，对所获取的语音信号进行波束生成，得到多个波束方向不同的语音波束；获取远端音源信息，其中，远端音源信息用于指示交互现场中远端音源相对麦克风阵列的方向；从多个语音波束中，确定波束方向与远端音源信息所指示方向不同的语音波束，作为可用波束。通过本方案，可以提高语音交互系统的互动质量。

4.

发明授权
信号发送方法、装置及电子设备有权

公开(公告)号：CN112911465B

公开(公告)日：2022-09-02

申请号：CN202110138609.5

申请日：2021-02-01

Applicant: 杭州海康威视数字技术股份有限公司

Inventor： 陈扬坤 , 童仁杰 , 杨茜

IPC: H04R1/40 , H04R3/02

Abstract: 本发明实施例提供了信号发送方法、装置及电子设备，该方法包括：获取语音信号，其中，语音信号是针对交互现场进行语音采集的麦克风阵列所采集的；基于预设的波束形成算法，对所获取的语音信号进行波束生成，得到多个波束方向不同的语音波束；获取远端音源信息，其中，远端音源信息用于指示交互现场中远端音源相对麦克风阵列的方向；从多个语音波束中，确定波束方向与远端音源信息所指示方向不同的语音波束，作为可用波束。通过本方案，可以提高语音交互系统的互动质量。

Patent Agency Ranking