-
公开(公告)号:CN101025918B
公开(公告)日:2011-06-29
申请号:CN200710062862.7
申请日:2007-01-19
Applicant: 清华大学
Abstract: 一种语音/音乐双模编解码无缝切换方法。当双模编解码器从基于CELP的语音模式切换到基于MDCT的音乐模式时,对切换前的最后一个CELP帧时域音频信号的尾部采用加窗和折叠处理,切换的连续性由MDCT变换的重叠相加性质保证;当双模编解码器从基于MDCT的音乐模式切换到基于CELP的语音模式时,切换前最后一个MDCT帧采用一种新的窗型使其与切换后第一个CELP帧无时域重叠,切换的连续性由预编码技术保证。该方法对采用CELP模式的音频时域信号进行特定的降采样处理,以适应两种编解码模式对输入音频信号采样率的不同要求以及音频信号动态的时频域特性。
-
公开(公告)号:CN101221766B
公开(公告)日:2011-01-05
申请号:CN200810056640.9
申请日:2008-01-23
Applicant: 清华大学
Abstract: 本发明公开了一种音频编码器切换的方法,属于多媒体信号处理和信源编码领域。所述方法包括:选取多个音频序列作为训练数据;根据预设的规则和所述训练数据对分类器进行训练,所述规则为采用主观音质评价方法对所述多个音频序列进行测试后得到的规则;当有音频信号输入时,所述分类器根据训练的结果对所述音频信号进行分类,并将其切换到相应的音频编码器中进行编码。本发明利用主观音质测试结果训练分类器,使分类器能够逼近主观听觉选择合适的编码器进行切换,既克服了AMR-WB+闭环切换方法计算量很大的缺点,而且与AMR-WB+开环切换方法相比,极大地提高了切换的准确率,使编码的质量得到了保证。
-
公开(公告)号:CN101673545A
公开(公告)日:2010-03-17
申请号:CN200810149581.X
申请日:2008-09-12
Abstract: 本发明提供了一种编解码方法及装置,涉及音频编码技术领域,为降低多声道压缩编解的复杂度、减少延时而发明。其中,编码方法包括:获取估计声道信号的估计声道分段信号和被估计声道信号的被估计声道分段信号;利用估计声道分段信号和被估计声道分段信号,确定估计声道分段信号中与被估计声道分段信号的各分段具有相关度的至少一个分段;利用估计声道分段信号中具有相关度的分段,对被估计声道分段信号进行估计,获得被估计声道分段信号的估计参数;将具有相关度的分段所对应的起始位置参数和估计参数进行编码形成估计参数码流;将估计声道分段信号进行编码,形成估计声道信号码流。本发明主要应用于多声道编解码技术中。
-
公开(公告)号:CN101582259A
公开(公告)日:2009-11-18
申请号:CN200810106460.7
申请日:2008-05-13
Abstract: 公开了立体声信号编解码方法、装置及系统。立体声信号编码方法包括:获取立体声信号在修正离散余弦变换MDCT域中的立体声信号的声道的频谱,将MDCT域中立体声信号的声道的频谱划分为谱线相互间隔的至少两个子频谱,将划分后的立体声信号的声道的子频谱进行MDCT域立体声信号编码处理。立体声信号解码方法包括:将编码后的立体声信号进行频谱矢量解码以获取立体声信号在MDCT域中的立体声信号的频谱,将MDCT域中立体声信号的频谱划分为谱线相互间隔的至少两个子频谱,将划分后的立体声信号的子频谱进行MDCT域立体声信号解码处理。本发明提供的技术方案能够在一定程度上避免包络失真等现象,提高了用户对立体声的音质体验。
-
公开(公告)号:CN101202043A
公开(公告)日:2008-06-18
申请号:CN200710304486.8
申请日:2007-12-28
Applicant: 清华大学
Abstract: 本发明公开了一种音频信号的编码方法和系统与解码方法和系统,属于多媒体信号处理和信源编码领域。编码方法包括:对左右声道的音频信号以极大相关度旋转角为旋转角进行正交旋转变换;对经过正交旋转变换的左右声道的音频信号进行编码。解码方法包括:对接收到的码流数据进行解码输出经过解码的音频信号;对经过解码的音频信号以极大相关度旋转角为旋转角进行正交逆旋转变换。编码系统包括:极大相关度旋转变换模块和编码模块。解码系统包括:解码模块和极大相关度逆旋转变换模块。本发明通过少量的极大相关度旋转角参数记录立体声信息,可以用很低的码率实现立体声音频信号的高保真压缩。
-
公开(公告)号:CN101635145B
公开(公告)日:2012-06-06
申请号:CN200810132296.7
申请日:2008-07-24
CPC classification number: H04S1/00 , G10H1/0041 , G10L19/008 , G10L19/0204
Abstract: 本发明实施例公开了一种编解码方法、装置和系统,音频编解码领域,为解决现有技术无法对双声道的立体声信号进行编解码的问题而发明。本发明实施例提供的方法,包括如下步骤:对左、右声道的信号下混后进行窄带编码,得到核心码流;将核心码流还原后与原左、右声道的信号做差,分别得到左、右声道的残差信号;获得所述左、右声道的残差信号的立体声码流和扩展码流;将所述核心码流、立体声码流和扩展码流复用成一路编码码流并发送。本发明适用于各种立体声语音音乐编解码系统。
-
公开(公告)号:CN101635145A
公开(公告)日:2010-01-27
申请号:CN200810132296.7
申请日:2008-07-24
CPC classification number: H04S1/00 , G10H1/0041 , G10L19/008 , G10L19/0204
Abstract: 本发明实施例公开了一种编解码方法、装置和系统,音频编解码领域,为解决现有技术无法对双声道的立体声信号进行编解码的问题而发明。本发明实施例提供的方法,包括如下步骤:对左、右声道的信号下混后进行窄带编码,得到核心码流;将核心码流还原后与原左、右声道的信号做差,分别得到左、右声道的残差信号;获得所述左、右声道的残差信号的立体声码流和扩展码流;将所述核心码流、立体声码流和扩展码流复用成一路编码码流并发送。本发明适用于各种立体声语音音乐编解码系统。
-
公开(公告)号:CN101221766A
公开(公告)日:2008-07-16
申请号:CN200810056640.9
申请日:2008-01-23
Applicant: 清华大学
Abstract: 本发明公开了一种音频编码器切换的方法,属于多媒体信号处理和信源编码领域。所述方法包括:选取多个音频序列作为训练数据;根据预设的规则和所述训练数据对分类器进行训练,所述规则为采用主观音质评价方法对所述多个音频序列进行测试后得到的规则;当有音频信号输入时,所述分类器根据训练的结果对所述音频信号进行分类,并将其切换到相应的音频编码器中进行编码。本发明利用主观音质测试结果训练分类器,使分类器能够逼近主观听觉选择合适的编码器进行切换,既克服了AMR-WB+闭环切换方法计算量很大的缺点,而且与AMR-WB+开环切换方法相比,极大地提高了切换的准确率,使编码的质量得到了保证。
-
-
-
-
-
-
-