用于编码和解码统合的语音与音频的设备

    公开(公告)号:CN102150205B

    公开(公告)日:2013-03-27

    申请号:CN200980135711.7

    申请日:2009-07-14

    CPC classification number: G10L19/20 G10L19/0212 G10L19/12

    Abstract: 本发明提供了一种统合地编码和解码语音信号(speech signal)和音频信号(audio signal)的编码设备,所述用于统合地编码语音信号和音频信号的编码设备可包括:模块选择单元(110),其分析输入信号的特征并选择用于编码输入信号的第一帧的第一编码模块;语音编码单元(130),其根据所述模块选择单元(110)的选择来编码输入信号,并生成语音比特流;音频编码单元(140),其根据所述模块选择单元(110)的选择来编码输入信号,并生成音频比特流;和比特流生成单元(150),其根据所述模块选择单元(110)的选择,从语音编码单元(130)或音频编码单元(140)生成输出比特流。

    多对象音频信号的附加信息比特流产生方法和装置

    公开(公告)号:CN102800321A

    公开(公告)日:2012-11-28

    申请号:CN201210234052.6

    申请日:2009-03-30

    Abstract: 本发明涉及一种多对象音频信号的附加信息比特流产生方法和装置。本发明的多对象音频信号的附加信息比特流产生装置,其特征在于,包括接收从多对象音频信号的编码装置产生的空间提示信息的空间提示信息输入部、接收关于所述多对象音频信号的预设信息的预设信息输入部、以及利用空间提示信息和预设信息产生附加信息比特流的附加信息比特流产生部,其中,附加信息比特流包括头区域和帧区域,预设信息包括在帧区域。根据本发明,具有这样的效果,即,通过在对多对象音频信号编码时产生的附加信息比特流的帧区域中包括预设信息,从而在再现多对象音频信号期间,也可根据编辑者或声音工程师的意图来改变所设定的音响场景信息。

    多对象音频信号的附加信息比特流产生方法和装置

    公开(公告)号:CN101981617B

    公开(公告)日:2012-08-29

    申请号:CN200980111798.4

    申请日:2009-03-30

    Abstract: 本发明涉及一种多对象音频信号的附加信息比特流产生方法和装置。本发明的多对象音频信号的附加信息比特流产生装置,其特征在于,包括接收从多对象音频信号的编码装置产生的空间提示信息的空间提示信息输入部、接收关于所述多对象音频信号的预设信息的预设信息输入部、以及利用空间提示信息和预设信息产生附加信息比特流的附加信息比特流产生部,其中,附加信息比特流包括头区域和帧区域,预设信息包括在帧区域。根据本发明,具有这样的效果,即,通过在对多对象音频信号编码时产生的附加信息比特流的帧区域中包括预设信息,从而在再现多对象音频信号期间,也可根据编辑者或声音工程师的意图来改变所设定的音响场景信息。

    对具有多声道的多对象音频信号进行编码和解码的设备和方法

    公开(公告)号:CN101689368B

    公开(公告)日:2012-08-22

    申请号:CN200880018050.5

    申请日:2008-03-31

    CPC classification number: G10L19/008

    Abstract: 提供了一种对具有多声道的多对象音频信号进行编码和解码的方法和设备。所述设备包括:多声道编码装置,对包括多个声道的音频信号进行缩混,产生用于所述包括多个声道的音频信号的空间提示,并产生包括产生的空间提示的第一渲染信息;多对象编码装置,对包括多个对象的音频信号进行缩混,其中,所述包括多个对象的音频信号包括来自多声道编码装置的缩混的信号,产生用于所述包括多个对象的音频信号的空间提示,产生包括产生的空间提示的第二渲染信息,其中,多声道编码装置不考虑编码器解码器(CODEC)方案而产生用于所述包括多个对象的音频信号的空间提示,该CODEC方案限制多声道编码单元。

    处理具有扩展空间性的声源的三维音频场景的方法

    公开(公告)号:CN100553374C

    公开(公告)日:2009-10-21

    申请号:CN200380103930.X

    申请日:2003-10-15

    Abstract: 一种处理其声源空间性被扩展的3D音频场景的方法描述声源的形状和大小属性。该方法包括步骤:a)产生包括声音对象的声源特征信息的三维音频场景描述信息;和b)对所述声音对象和包括所述声音对象的声源特征信息的三维音频场景描述信息进行编码,其中,所述声源特征信息包括声源的空间性扩展信息,该信息是关于在三维空间中表示的声源的大小和形状的信息。

Patent Agency Ranking