一种VAD判决中当前激活音保持帧数的修正方法及装置

    公开(公告)号:CN109119096B

    公开(公告)日:2021-01-22

    申请号:CN201810622976.0

    申请日:2012-12-25

    Abstract: 本发明实施例提供了一种激活音检测VAD判决中当前激活音保持帧数的修正方法及装置、信噪比门限的调整方法及装置,其中,所述修正方法包括:获得当前帧的子带信号及频谱幅值;根据子带信号计算得到长时信噪比lt_snr和平均全带信噪比SNR2_lt_ave;根据前面多个帧的VAD判决结果、长时信噪比lt_snr、平均全带信噪比SNR2_lt_ave以及当前帧的VAD判决结果,对当前激活音保持帧数进行修正。本发明技术方案可以提高不稳定噪声和音乐检测的准确率。

    一种进行语音自适应非连续传输的方法及装置

    公开(公告)号:CN102903364A

    公开(公告)日:2013-01-30

    申请号:CN201110216374.3

    申请日:2011-07-29

    CPC classification number: G10L19/012

    Abstract: 本发明公开了一种进行语音自适应非连续传输的方法及装置,此方法包括:在进行语音自适应非连续传输中,根据当前的语音信号帧和上一静音插入描述帧的频谱信息决定是否发送静音插入描述帧。本方案可以克服现有技术中的采用固定间隔方式不能灵活跟踪信号变化,采用可变间隔方式又必须有线性预测等多参数的计算导致计算复杂度高的缺点。本方案直接在频域进行,能很好地跟踪信号的变化,在保持较低平均码率的同时保证音质。

    可分层音频编解码方法系统及瞬态信号可分层编解码方法

    公开(公告)号:CN102222505B

    公开(公告)日:2012-12-19

    申请号:CN201010145531.1

    申请日:2010-04-13

    CPC classification number: G10L19/24 G10L19/025

    Abstract: 可分层音频编码、解码方法及系统。编码方法:对当前帧的音频信号进行瞬态判决;时域变换得到当前帧总频域系数;对核心层编码子带和扩展层编码子带的幅值包络值进行量化和编码得到核心层编码子带和扩展层编码子带的幅值包络量化指数及其编码比特;对核心层频域系数进行量化和编码得到核心层频域系数的编码比特;对核心层中经过矢量量化的频域系数进行反量化,并与原始的频域系数进行差计算,得到核心层残差信号,计算其幅值包络量化指数;对扩展层编码信号进行量化和编码得到扩展层编码信号的编码比特;将核心层和扩展层编码子带的幅值包络编码比特、核心层频域系数编码比特和扩展层编码信号的编码比特复用打包后,传送给解码端。

    可分层音频编解码方法系统及瞬态信号可分层编解码方法

    公开(公告)号:CN102222505A

    公开(公告)日:2011-10-19

    申请号:CN201010145531.1

    申请日:2010-04-13

    CPC classification number: G10L19/24 G10L19/025

    Abstract: 可分层音频编码、解码方法及系统。编码方法:对当前帧的音频信号进行瞬态判决;时域变换得到当前帧总频域系数;对核心层编码子带和扩展层编码子带的幅值包络值进行量化和编码得到核心层编码子带和扩展层编码子带的幅值包络量化指数及其编码比特;对核心层频域系数进行量化和编码得到核心层频域系数的编码比特;对核心层中经过矢量量化的频域系数进行反量化,并与原始的频域系数进行差计算,得到核心层残差信号,计算其幅值包络量化指数;对扩展层编码信号进行量化和编码得到扩展层编码信号的编码比特;将核心层和扩展层编码子带的幅值包络编码比特、核心层频域系数编码比特和扩展层编码信号的编码比特复用打包后,传送给解码端。

    频带复制方法、装置及音频解码方法、系统

    公开(公告)号:CN102194458A

    公开(公告)日:2011-09-21

    申请号:CN201019185063.8

    申请日:2010-03-02

    Abstract: 本发明涉及一种频带复制方法、装置及音频解码方法、系统,频带复制方法包括:A、在MDCT频域系数中搜索音频信号的某个音调所在的位置;B、根据音调所在位置确定频带复制周期和源频段,该频带复制周期为0频点到音调位置的频点的带宽,该源频段为从0频点向后偏移copyband_offset个频点到音调位置的频点向后偏移所述copyband_offset个频点的频段,其中所述偏移量copyband_offset大于或等于0;C、根据频带复制周期对零比特编码子带进行频带复制。本发明可以很好地解决音频编解码过程中未被编码的编码子带的音频信号的恢复问题。

    一种激活音检测VAD判决中信噪比门限的调整方法及装置

    公开(公告)号:CN112992188B

    公开(公告)日:2024-06-18

    申请号:CN202110060370.4

    申请日:2012-12-25

    Abstract: 本发明提供一种激活音检测VAD判决中信噪比门限的调整方法,包括:获得当前帧的子带信号及频谱幅值;根据子带信号计算得到当前帧的谱重心特征参数;通过前一帧的平均长时激活音信号能量和平均长时背景噪声能量的比值,计算得到长时信噪比lt_snr;根据所述谱重心特征参数、所述长时信噪比lt_snr、前面连续激活音帧的个数continuous_speech_num和前面连续噪声帧的个数continuous_noise_num来调整VAD判决的信噪比门限。

    一种VAD判决中当前激活音保持帧数的修正方法及装置

    公开(公告)号:CN109119096A

    公开(公告)日:2019-01-01

    申请号:CN201810622976.0

    申请日:2012-12-25

    Abstract: 本发明实施例提供了一种激活音检测VAD判决中当前激活音保持帧数的修正方法及装置、信噪比门限的调整方法及装置,其中,所述修正方法包括:获得当前帧的子带信号及频谱幅值;根据子带信号计算得到长时信噪比lt_snr和平均全带信噪比SNR2_lt_ave;根据前面多个帧的VAD判决结果、长时信噪比lt_snr、平均全带信噪比SNR2_lt_ave以及当前帧的VAD判决结果,对当前激活音保持帧数进行修正。本发明技术方案可以提高不稳定噪声和音乐检测的准确率。

    音频编解码方法、系统及噪声水平估计方法

    公开(公告)号:CN102194457B

    公开(公告)日:2013-02-27

    申请号:CN201019185061.9

    申请日:2010-03-02

    Abstract: 本发明涉及一种音频编解码方法、系统及噪声水平估计方法,本发明的噪声水平估计方法包括:根据待编码音频信号的频域系数估计待编码音频信号的功率谱;根据计算得到的功率谱估计零比特编码子带音频信号的噪声水平,该噪声水平用于在解码时控制噪声填充和频带复制的能量的比例;其中,零比特编码子带指分配到的比特数为零的编码子带。本发明可以以很好地重构未被编码的频域系数。

    音频编解码方法、系统及噪声水平估计方法

    公开(公告)号:CN102194457A

    公开(公告)日:2011-09-21

    申请号:CN201019185061.9

    申请日:2010-03-02

    Abstract: 本发明涉及一种音频编解码方法、系统及噪声水平估计方法,本发明的噪声水平估计方法包括:根据待编码音频信号的频域系数估计待编码音频信号的功率谱;根据计算得到的功率谱估计零比特编码子带音频信号的噪声水平,该噪声水平用于在解码时控制噪声填充和频带复制的能量的比例;其中,零比特编码子带指分配到的比特数为零的编码子带。本发明可以以很好地重构未被编码的频域系数。

    激活音检测及用于激活音检测的方法和装置

    公开(公告)号:CN103903634B

    公开(公告)日:2018-09-04

    申请号:CN201210570563.5

    申请日:2012-12-25

    Abstract: 本发明涉及一种激活音检测(VAD)及用于激活音检测的方法和装置,该方法包括:获得当前帧的子带信号及频谱幅值;根据子带信号计算得到当前帧的帧能量参数和谱重心特征参数的值;根据前一帧估计得到的背景噪声能量、当前帧的帧能量参数及信噪比子带能量计算得到当前帧的信噪比参数;根据调性标志、信噪比参数、谱重心特征参数、帧能量参数计算得到VAD判决结果。本发明方法和装置可提高不稳定噪声(如办公室噪声)和音乐检测的准确率。

Patent Agency Ranking