-
公开(公告)号:CN111770427A
公开(公告)日:2020-10-13
申请号:CN202010588457.4
申请日:2020-06-24
Applicant: 杭州海康威视数字技术股份有限公司
Inventor: 陈扬坤
IPC: H04R29/00 , G10L21/0224 , G10L21/0232 , G10L25/18 , G10L25/24 , G10L25/30 , G10L25/45
Abstract: 本申请提供一种麦克风阵列的检测方法、装置、设备以及存储介质。该方法通过根据麦克风阵列采集的音频信号的音频特征,确定所述音频信号是否包含违规声音信号,并在所述音频信号包含违规声音信号时,对音频信号进行特征提取,得到每帧音频信号的时频特征,时频特征用于指示该路音频信号的频域幅度特征和时域能量特征,并将每帧音频信号的时频特征输入到预训练得到的麦克风异常检测模型,得到麦克风阵列中各麦克风是否异常的检测结果,提高对用于采集违规声音的麦克风阵列检测的准确性。
-
公开(公告)号:CN110797042A
公开(公告)日:2020-02-14
申请号:CN201810878964.4
申请日:2018-08-03
Applicant: 杭州海康威视数字技术股份有限公司
IPC: G10L21/0216
Abstract: 本申请公开了一种音频处理方法、装置及存储介质,属于语音处理技术领域。该方法包括:获取多个音频采样频点对应的波束形成系数矩阵,获取到的多个波束形成系数矩阵是基于从麦克风阵列对应的圆形区域内选取的目标扇形区域确定的,多个波束形成系数矩阵用于控制在目标扇形区域指代的音频采集区域内采集的音频信号为静音状态,分别确定麦克风阵列中每个麦克风采集的音频信号在多个音频采样频点下的频域信号,将每个波束形成系数矩阵作为每个麦克风在对应音频采样频点下的频域信号的系数,对确定的频域信号进行变换处理,得到目标音频信号。本申请在不影响采集需求的音频信号的情况下,可以抑制掉需要静音的目标扇形区域的音频信号。
-
公开(公告)号:CN107548007B
公开(公告)日:2020-02-04
申请号:CN201610485200.X
申请日:2016-06-23
Applicant: 杭州海康威视数字技术股份有限公司
IPC: H04R29/00
Abstract: 本发明实施例公开了一种音频信号采集设备检测方法及装置,方法包括:获得待检测的音频信号,提取该音频信号中的N帧时域音频数据,计算其能量值并判断与预设的能量值阈值的大小关系,若该能量值不小于该阈值,则将N帧时域音频数据转换为N帧频域音频数据,提取每一帧的谱峰频率,判断N帧频域音频数据的谱峰频率是否稳定,如果稳定,则判定音频信号采集设备连接异常。应用本发明实施例,可以提高检测音频信号采集设备是否连接异常的准确性。
-
公开(公告)号:CN109993977A
公开(公告)日:2019-07-09
申请号:CN201711478558.0
申请日:2017-12-29
Applicant: 杭州海康威视数字技术股份有限公司
Abstract: 本发明是关于检测车辆鸣笛的方法、装置以及系统,属于安防监控领域。本发明提供了一种对汽车鸣笛声进行检测并定位相应车辆的方案,通过在禁止鸣笛区域安装一定数量的麦克风,一旦有车辆进行违规鸣笛,即可检测出车辆的大致区域,然后再借助摄像头拍摄的监控图像对鸣笛动作识别进行二次确认,防止误报,大大提高检测精度。
-
公开(公告)号:CN105338292A
公开(公告)日:2016-02-17
申请号:CN201410380045.6
申请日:2014-08-04
Applicant: 杭州海康威视数字技术股份有限公司
Abstract: 本发明公开了一种用于视频监控的声源定向控制装置及方法。在本发明中,声音拾取部件可与摄像头同步旋转,因而能够形成随摄像头同步转动的动态声源坐标系,相应地,基于该动态声源坐标系,解算得到的方位角就为声源相比于摄像头的镜头法线的相对方位角,进而,通过使该相对方位角向预先设定的角度范围内收敛,即可实现对该相对方位角的闭环控制、并通过对该相对方位角的闭环控制使摄像头的镜头视角范围追踪声源所处方位。由于对该相对方位角的闭环控制产生的环路增益能够抑制方位角解算算法产生的精度误差,因而本发明无需提高解算算法的精确度即可提高定向的准确性,从而能够节省运行算法所消耗的资源。
-
公开(公告)号:CN117041790A
公开(公告)日:2023-11-10
申请号:CN202311122598.7
申请日:2023-08-31
Applicant: 杭州海康威视数字技术股份有限公司
Inventor: 陈扬坤
IPC: H04R1/08
Abstract: 本申请公开了一种麦克风阵列的拾音方法、装置、存储介质和电子设备,包括:对麦克风阵列中所有全向麦克风的接收信号,按照拾音角度对应的波束系数进行处理得到波束信号,并对波束信号进行波束增强,得到第一信号;对麦克风阵列中所有定向麦克风的接收信号进行降噪处理,得到第二信号;基于第一信号与第二信号,计算比例特征值;当比例特征值不大于基于用户指示的拾音距离确定出的第一阈值时,基于比例特征值计算第一信号与第二信号的融合比例,并按照融合比例将第一信号与第二信号融合为拾音信号进行输出。应用本申请,能够实现限定方向和距离范围内的拾音处理,提高拾音信号的准确性。
-
公开(公告)号:CN114038452A
公开(公告)日:2022-02-11
申请号:CN202111362514.8
申请日:2021-11-17
Applicant: 杭州海康威视数字技术股份有限公司
Abstract: 本申请公开了一种语音分离方法和设备,涉及计算机软件技术领域,用于提高声源定位的准确度,提升语音分离准确性。该方法包括:获取图像采集设备在预设时间段内采集的目标场景的待处理图像,以及声音采集设备在预设时间段内采集的目标场景的混合声音信号;待处理图像包括第一声源的图像,混合声音信号由第一声源的声音信号和其他声音信号混合而成;基于第一声源的图像在待处理图像中的位置信息,以及图像采集设备相对于声音采集设备的方位信息,确定第一声源相对于声音采集设备的第一方位;增强混合声音信号中的第一方位的声音信号,并抑制除第一方位之外的其他方位的声音信号,得到第一声源的声音信号。
-
公开(公告)号:CN113362850A
公开(公告)日:2021-09-07
申请号:CN202010140336.3
申请日:2020-03-03
Applicant: 杭州海康威视数字技术股份有限公司
Inventor: 陈扬坤
Abstract: 本申请提供一种音频信号采集设备的检测方法、设备和存储介质。该方法包括:获取所述音频信号采集设备采集的至少一路音频信号;分别提取各路所述音频信号的幅值特征;根据各路所述音频信号的幅值特征,利用预先训练得到的机器学习模型,确定所述音频信号采集设备是否异常。本申请实施例提高了检测结果的准确性。
-
公开(公告)号:CN109669158B
公开(公告)日:2021-04-20
申请号:CN201710958145.6
申请日:2017-10-16
Applicant: 杭州海康威视数字技术股份有限公司
IPC: G01S5/20
Abstract: 本发明实施例提供了一种声源定位方法、系统、计算机设备及存储介质,其中,声源定位方法包括:获取声音传感器阵列中属于第一传感器对和第二传感器对的各声音传感器接收到的声音信号;根据第一传感器对中各声音传感器分别接收到的声音信号,分别计算各预先划分的区域对应的第一传播功率;根据第二传感器对中各声音传感器分别接收到的声音信号,分别计算各预先划分的区域对应的第二传播功率;确定多个第一传播功率中的最大值对应的多个第一区域以及多个第二传播功率中的最大值对应的多个第二区域;定位多个第一区域与多个第二区域的重合区域的方向为声源的方向。通过本方案可以保证准确定位声源。
-
公开(公告)号:CN107976651B
公开(公告)日:2020-12-25
申请号:CN201610917562.1
申请日:2016-10-21
Applicant: 杭州海康威视数字技术股份有限公司
IPC: G01S5/20 , G10L21/0208 , G10L21/0216
Abstract: 本发明实施例公开了一种基于麦克风阵列的声源定位方法及装置,所述方法包括:获取经所述麦克风阵列传输的语音信号,对所述语音信号进行分帧处理,并确定目标语音信号;确定所述目标语音信号中的目标频率点,并根据所述目标频率点,针对所述麦克风阵列中的预设位置,分别确定各预设位置的声压信号;根据所述各预设位置的声压信号和预设方位角,计算各预设方位角对应的波束响应值,并基于所述各预设方位角对应的波束响应值,确定声源方位角。由于声压信号具有一定指向性,因此采用预设位置的声压信号计算波束响应值,进而确定声源的方位角,可以在麦克风阵列尺寸较小的微型阵列条件下准确地定位声源的方位。
-
-
-
-
-
-
-
-
-