一种激活音检测VAD判决中信噪比门限的调整方法及装置

    公开(公告)号:CN112992188A

    公开(公告)日:2021-06-18

    申请号:CN202110060370.4

    申请日:2012-12-25

    Abstract: 本发明提供一种激活音检测VAD判决中信噪比门限的调整方法,包括:获得当前帧的子带信号及频谱幅值;根据子带信号计算得到当前帧的谱重心特征参数;通过前一帧的平均长时激活音信号能量和平均长时背景噪声能量的比值,计算得到长时信噪比lt_snr;根据所述谱重心特征参数、所述长时信噪比lt_snr、前面连续激活音帧的个数continuous_speech_num和前面连续噪声帧的个数continuous_noise_num来调整VAD判决的信噪比门限。

    激活音检测的方法及装置

    公开(公告)号:CN105261375B

    公开(公告)日:2018-08-31

    申请号:CN201410345942.3

    申请日:2014-07-18

    Inventor: 朱长宝 袁浩

    CPC classification number: G10L25/84 G10L21/038 G10L25/21 G10L25/78

    Abstract: 本发明提供了一种激活音检测的方法及装置,其中,上述方法包括:获取第一特征组中的至少一个第一类特征参数,第二特征组中的至少一个第二类特征参数,以及至少两个已有VAD判决结果,其中,所述第一类特征参数和所述第二类特征参数均为用于VAD检测的特征参数;根据所述第一类特征参数、所述第二类特征参数以及所述至少两个已有激活音检测判决结果进行激活音检测,得到联合VAD判决结果。解决了相关技术中,VAD方案检测不准确等技术问题,提高了VAD的准确性,进而提升了用户体验。

    一种激活音检测VAD判决中信噪比门限的调整方法及装置

    公开(公告)号:CN112992188B

    公开(公告)日:2024-06-18

    申请号:CN202110060370.4

    申请日:2012-12-25

    Abstract: 本发明提供一种激活音检测VAD判决中信噪比门限的调整方法,包括:获得当前帧的子带信号及频谱幅值;根据子带信号计算得到当前帧的谱重心特征参数;通过前一帧的平均长时激活音信号能量和平均长时背景噪声能量的比值,计算得到长时信噪比lt_snr;根据所述谱重心特征参数、所述长时信噪比lt_snr、前面连续激活音帧的个数continuous_speech_num和前面连续噪声帧的个数continuous_noise_num来调整VAD判决的信噪比门限。

    一种身份认证的方法和装置

    公开(公告)号:CN107221333B

    公开(公告)日:2019-11-08

    申请号:CN201610162027.X

    申请日:2016-03-21

    Abstract: 一种身份认证的方法,包括:获取输入语音的语音特征,将语音特征与预存的目标声纹模型进行匹配得到声纹匹配分数;根据所述语音特征和目标文本模型对输入语音进行切分,获取初始切分单元以及初始语音切分单元的个数,如初始语音切分单元的个数大于或等于第一阈值,则对初始切分单元进行强制切分,使得切分单元的总个数与预设的目标文本的个数相同;将每个切分单元的语音特征与所有目标文本模型进行匹配,得到每个切分单元与每个目标文本模型的切分单元文本匹配分数;根据所述切分单元文本匹配分数、声纹匹配分数和预先训练的概率神经网络PNN分类器进行身份认证,本方案实现了对用户进行双重验证的目的,提高了系统的安全性、可靠性和准确性。

    一种基于声纹识别的安全防护方法和装置

    公开(公告)号:CN105989267A

    公开(公告)日:2016-10-05

    申请号:CN201510085577.1

    申请日:2015-02-16

    Abstract: 本发明公开了一种基于声纹识别的安全防护方法,该方法包括:采集终端当前使用者的语音数据,并从所述语音数据中提取声纹特征信息;将提取到的终端当前使用者的声纹特征信息与预先保存的终端所有者的声纹模型进行匹配,判断所述终端当前使用者是否为终端所有者;在判定所述终端当前使用者不是终端所有者时,对所述终端进行安全防护处理。本发明能够通过声纹识别技术监测并及时阻止终端被冒用,避免终端所有者蒙受损失。本发明还公开了一种基于声纹识别的安全防护装置。

    激活音检测方法和装置
    8.
    发明授权

    公开(公告)号:CN104424956B9

    公开(公告)日:2022-11-25

    申请号:CN201310390795.7

    申请日:2013-08-30

    Inventor: 朱长宝 袁浩

    Abstract: 本发明提供了一种激活音检测方法和装置。解决了现有VAD检测不准确的问题。该方法包括:根据连续激活音帧个数、平均全带信噪比、调性信号标志和至少两种已有VAD判决结果得到最终联合VAD判决结果。本发明提供的技术方案适用于语音业务,实现了高准确性的VAD判决。

    一种VAD判决中当前激活音保持帧数的修正方法及装置

    公开(公告)号:CN109119096A

    公开(公告)日:2019-01-01

    申请号:CN201810622976.0

    申请日:2012-12-25

    Abstract: 本发明实施例提供了一种激活音检测VAD判决中当前激活音保持帧数的修正方法及装置、信噪比门限的调整方法及装置,其中,所述修正方法包括:获得当前帧的子带信号及频谱幅值;根据子带信号计算得到长时信噪比lt_snr和平均全带信噪比SNR2_lt_ave;根据前面多个帧的VAD判决结果、长时信噪比lt_snr、平均全带信噪比SNR2_lt_ave以及当前帧的VAD判决结果,对当前激活音保持帧数进行修正。本发明技术方案可以提高不稳定噪声和音乐检测的准确率。

    一种维护动物数据库的方法、装置和系统

    公开(公告)号:CN107766372A

    公开(公告)日:2018-03-06

    申请号:CN201610694221.2

    申请日:2016-08-19

    CPC classification number: G06F16/00 G06F16/683 G06F16/433 G10L17/26

    Abstract: 本发明提供了一种维护动物数据库的方法、装置和系统,预先建立好的动物数据库中包括至少一个物种子库,每个物种子库包括声纹信息库和多媒体信息库,获取周围的声音时,从获取到的源声信号中提取出第一声纹信息,将其与各个物种子库中的声纹信息库中的声纹模型进行匹配,如果匹配成功,则将该源声信号保存在对应的多媒体信息库中,然后分析各源声信号的第二声纹信息,将各个物种子库中的源声信号进行聚类,从而实现了无需人工操作便能维护动物声音数据库的功能,大大提高了在各个区域搜集动物资料的效率,同时为在所搜集区域实现动物数量的自动统计、建立动物个体的个性化数据库提供了便利。

Patent Agency Ranking