多模式多级码本联合优化方法

    公开(公告)号:CN104795074B

    公开(公告)日:2019-01-04

    申请号:CN201510121820.0

    申请日:2015-03-19

    Abstract: 本发明公开了一种多模式多级码本联合优化方法,属于低速率语音编码矢量量化技术领域,解决了现有的多模式多级码本训练中,误码对系统失真的影响较大的技术问题。该多模式多级码本联合优化方法包括:输出待量化矢量;对所述待量化矢量进行训练,获得各模式各级初始化码本;对所述各模式各级初始化码本进行码本索引的重排,获得新的码本;对所述待量化矢量,利用新的码本,寻找使得系统失真最小的最优胞腔和量化索引;利用输入残差矢量和对应的量化索引,更新各级各模式最优码字,并迭代至预设次数;获取最后一次迭代得出的码本。

    一种噪声功率估计方法
    2.
    发明公开

    公开(公告)号:CN103646648A

    公开(公告)日:2014-03-19

    申请号:CN201310585440.3

    申请日:2013-11-19

    Abstract: 本发明公开了一种噪声功率估计方法,该方法首先对输入带噪语音进行采样得到输入带噪语音信号样点,并按时间顺序对样点进行分帧,并得到一系列分析帧。随后根据当前分析帧中的带噪语音信号样点计算得到当前分析帧的最大归一化自相关值、当前分析帧中各频点的带噪语音功率和后验信噪比,并计算当前分析帧中各频点的语音存在概率。最后根据前一分析帧中各频点的噪声功率估计值、当前分析帧中各频点的带噪语音功率和语音存在概率计算得到当前分析帧中各频点的噪声功率估计值。本发明运算简单,占用存储资源小,能够快速估计各种噪声的功率。

    声码器基音周期参数抗信道误码方法

    公开(公告)号:CN1975861B

    公开(公告)日:2011-06-29

    申请号:CN200610165245.5

    申请日:2006-12-15

    Applicant: 清华大学

    Abstract: 本发明属于语音压缩编码技术领域。该方法首先对输入信号样点分帧;对当前帧提取基音周期和清浊音参数,并量化编码传输;解码端解码后得到基音周期和清浊音参数;如当前帧不是清音或清浊音过渡段的第一或第二帧浊音,则将其基音周期参数与上一帧作比较;若二者差值超过一个设定阈值,则判定当前帧基音周期参数传输出错;若上一帧基音周期参数未出错,而当前帧基音周期参数传输出错,则将当前帧基音周期参数量化传输的二进制表示的各比特分别反转,求取对应的基音周期参数,作为候选基音周期参数;将其分别与上一帧基音周期参数作比较,取差值最小的作为恢复值。该方法可提高声码器基音周期参数抗信道误码能力,最适合低速率语音编码。

    0.6kb/s声码器能量参数增益形状量化的联合搜索方法

    公开(公告)号:CN101030376A

    公开(公告)日:2007-09-05

    申请号:CN200710065402.X

    申请日:2007-04-13

    Applicant: 清华大学

    Abstract: 本发明属于低速率语音压缩编码技术领域,其特征在于,在求取了连续三个语音帧的能量参数后,求取其能量平均值,并对该平均值进行均匀标量量化得到量化索引。以得到的量化索引为中心确定一个候选区间,并将此候选区间内的值进行反标量量化,用反标量量化后的值对连续三帧的能量参数进行归一化得到归一化矢量,进行矢量量化。对候选区内的所有值进行上述运算,找到量化误差最小的区间值与码本索引。这种方法可以降低能量参数的量化误差,提高合成语音的自然度。该方法适合低速率参数语音编码。

    H.264/AVC视频编码中速率和失真的快速估计方法

    公开(公告)号:CN101014128A

    公开(公告)日:2007-08-08

    申请号:CN200710063488.2

    申请日:2007-02-02

    Applicant: 清华大学

    Abstract: 本发明涉及视频压缩编码中宏块编码模式选择算法,其特征在于,该方法首先对运动预测,变换和量化后的信号进行快速速率和失真估计;在失真估计算法中,对于量化后为零的变换系数,失真即为经过加权后的系数平方值,对于非零量化系数,失真为量化步长的平方值函数;在速率估计算法中,建立速率和非零量化系数绝对值之和、非零量化系数数目及游程值之和的关系模型。定义一个查表函数度量非零量化系数数目及游程值之和对速率的影响,每实际编码一个块后根据低通滤波的原理更新该查找表;根据速率和失真的估计,进行宏块编码模式的选择。本发明有效提高了率失真意义下宏块编码模式选择的速度,适用于新一代视频压缩编码。

    1.2kb/s SELP低速率声码器抗信道误码保护方法

    公开(公告)号:CN101009097A

    公开(公告)日:2007-08-01

    申请号:CN200710063062.7

    申请日:2007-01-26

    Applicant: 清华大学

    Abstract: 本发明属于低速率语音抗差错编码技术领域,其特征在于,该方法在编码端对1.2kb/sSELP编码后的清浊音参数按权重重排并加重汉明距离;采用两组BCH(15,7)码和奇偶校验分别保护清音和浊音帧中的语音参数;在解码端,根据信源信道的联合特性采用分支判决确定清浊音并采用基于长时统计特性的最大后验概率准则恢复清浊音参数;对于清音帧采用BCH码恢复出对应参数,对于浊音帧,解码出线谱对参数第一级并对奇偶校验失败的线谱对参数采用线谱对参数抗误码算法恢复。该方法在不消耗任何额外带宽且无延时的要求下可以显著提高1.2kb/s SELP声码器抗信道误码能力和合成语音质量。

    子带清浊音模糊判决的方法

    公开(公告)号:CN101009096A

    公开(公告)日:2007-08-01

    申请号:CN200610165246.X

    申请日:2006-12-15

    Applicant: 清华大学

    Abstract: 子带清浊音模糊判决方法,属于低速率语音压缩编码技术领域。其特征在于,在利用目前通用的带通浊音度参数提取方法得到除第一子带以外的其余四个子带的浊音隶属度后,将第一个子带滤波后信号的自相关函数在基音周期参数处的值乘以一个设定的增益因子,作为第一个子带的浊音隶属度,如果结果超过1,则令其等于1;将各子带的浊音隶属度一起进行矢量量化,得到量化后各子带的浊音隶属度,和基音周期参数等一起合成激励信号。这种方法可以提高合成语音的自然度。该方法适合低速率参数语音编码。

    一种超帧声道参数矢量量化方法

    公开(公告)号:CN1284137C

    公开(公告)日:2006-11-08

    申请号:CN200410090661.4

    申请日:2004-11-12

    Applicant: 清华大学

    Abstract: 本发明涉及超帧声道参数矢量量化方法,属于低速率语音压缩编码技术领域。该方法首先对输入语音信号样点按时间顺序分帧;将连续的若干帧组成一个超帧,对超帧按时间顺序进行处理;对当前超帧中的每一帧提取声道A参数和清浊音参数;对当前超帧的清浊音参数矢量量化,根据量化值确定当前超帧的模式;将该提取的声道A参数转换成线谱对参数;从当前超帧线谱对参数中减去直流分量,直流分量由当前超帧模式确定;根据前一超帧和当前超帧的模式确定线谱对参数预测值,从去直流线谱对参数中减去该预测值,然后进行矢量量化。这种方法可以提高声道参数的量化精度,使合成语音具有更高的可懂性。该方法最适合600~800b/s低速率参数语音编码。

    一种超帧声道参数平滑和抽取矢量量化的方法

    公开(公告)号:CN1284136C

    公开(公告)日:2006-11-08

    申请号:CN200410096618.9

    申请日:2004-12-03

    Applicant: 清华大学

    Abstract: 本发明涉及超帧声道参数矢量量化方法,属于低速率语音压缩编码技术领域。该方法首先对输入语音信号样点按时间顺序分帧,将连续的若干帧组成一个超帧;对当前超帧中的每一帧提取声道A参数,然后转换成线谱对参数,并进行平滑;对当前超帧中的每一帧提取清浊音参数、进行矢量量化,再根据量化值确定当前超帧的模式,进而确定当前超帧中的重要帧和非重要帧;从当前超帧中重要帧线谱对参数中减去直流分量,从重要帧去直流线谱对参数中减去预测值后进行矢量量化;利用量化后重要帧线谱对参数插值得到非重要帧量化后的线谱对参数;将量化后的线谱对参数转换成声道A参数。这种方法可以提高声道参数的量化精度,适用于300~1200bps语音编码。

    一种超帧声道参数矢量量化方法

    公开(公告)号:CN1614686A

    公开(公告)日:2005-05-11

    申请号:CN200410090661.4

    申请日:2004-11-12

    Applicant: 清华大学

    Abstract: 本发明涉及超帧声道参数矢量量化方法,属于低速率语音压缩编码技术领域。该方法首先对输入语音信号样点按时间顺序分帧;将连续的若干帧组成一个超帧,对超帧按时间顺序进行处理;对当前超帧中的每一帧提取声道A参数和清浊音参数;对当前超帧的清浊音参数矢量量化,根据量化值确定当前超帧的模式;将该提取的声道A参数转换成线谱对参数;从当前超帧线谱对参数中减去直流分量,直流分量由当前超帧模式确定;根据前一超帧和当前超帧的模式确定线谱对参数预测值,从去直流线谱对参数中减去该预测值,然后进行矢量量化。这种方法可以提高声道参数的量化精度,使合成语音具有更高的可懂性。该方法最适合600~800b/s低速率参数语音编码。

Patent Agency Ranking