-
公开(公告)号:CN102150205B
公开(公告)日:2013-03-27
申请号:CN200980135711.7
申请日:2009-07-14
Applicant: 韩国电子通信研究院
IPC: G10L19/20
CPC classification number: G10L19/20 , G10L19/0212 , G10L19/12
Abstract: 本发明提供了一种统合地编码和解码语音信号(speech signal)和音频信号(audio signal)的编码设备,所述用于统合地编码语音信号和音频信号的编码设备可包括:模块选择单元(110),其分析输入信号的特征并选择用于编码输入信号的第一帧的第一编码模块;语音编码单元(130),其根据所述模块选择单元(110)的选择来编码输入信号,并生成语音比特流;音频编码单元(140),其根据所述模块选择单元(110)的选择来编码输入信号,并生成音频比特流;和比特流生成单元(150),其根据所述模块选择单元(110)的选择,从语音编码单元(130)或音频编码单元(140)生成输出比特流。
-
公开(公告)号:CN102800321A
公开(公告)日:2012-11-28
申请号:CN201210234052.6
申请日:2009-03-30
Applicant: 韩国电子通信研究院
IPC: G10L19/00
Abstract: 本发明涉及一种多对象音频信号的附加信息比特流产生方法和装置。本发明的多对象音频信号的附加信息比特流产生装置,其特征在于,包括接收从多对象音频信号的编码装置产生的空间提示信息的空间提示信息输入部、接收关于所述多对象音频信号的预设信息的预设信息输入部、以及利用空间提示信息和预设信息产生附加信息比特流的附加信息比特流产生部,其中,附加信息比特流包括头区域和帧区域,预设信息包括在帧区域。根据本发明,具有这样的效果,即,通过在对多对象音频信号编码时产生的附加信息比特流的帧区域中包括预设信息,从而在再现多对象音频信号期间,也可根据编辑者或声音工程师的意图来改变所设定的音响场景信息。
-
公开(公告)号:CN101981617B
公开(公告)日:2012-08-29
申请号:CN200980111798.4
申请日:2009-03-30
Applicant: 韩国电子通信研究院
IPC: G10L19/00
Abstract: 本发明涉及一种多对象音频信号的附加信息比特流产生方法和装置。本发明的多对象音频信号的附加信息比特流产生装置,其特征在于,包括接收从多对象音频信号的编码装置产生的空间提示信息的空间提示信息输入部、接收关于所述多对象音频信号的预设信息的预设信息输入部、以及利用空间提示信息和预设信息产生附加信息比特流的附加信息比特流产生部,其中,附加信息比特流包括头区域和帧区域,预设信息包括在帧区域。根据本发明,具有这样的效果,即,通过在对多对象音频信号编码时产生的附加信息比特流的帧区域中包括预设信息,从而在再现多对象音频信号期间,也可根据编辑者或声音工程师的意图来改变所设定的音响场景信息。
-
公开(公告)号:CN101689368B
公开(公告)日:2012-08-22
申请号:CN200880018050.5
申请日:2008-03-31
Applicant: 韩国电子通信研究院
IPC: G10L19/00
CPC classification number: G10L19/008
Abstract: 提供了一种对具有多声道的多对象音频信号进行编码和解码的方法和设备。所述设备包括:多声道编码装置,对包括多个声道的音频信号进行缩混,产生用于所述包括多个声道的音频信号的空间提示,并产生包括产生的空间提示的第一渲染信息;多对象编码装置,对包括多个对象的音频信号进行缩混,其中,所述包括多个对象的音频信号包括来自多声道编码装置的缩混的信号,产生用于所述包括多个对象的音频信号的空间提示,产生包括产生的空间提示的第二渲染信息,其中,多声道编码装置不考虑编码器解码器(CODEC)方案而产生用于所述包括多个对象的音频信号的空间提示,该CODEC方案限制多声道编码单元。
-
公开(公告)号:CN102067490A
公开(公告)日:2011-05-18
申请号:CN200980123773.6
申请日:2009-04-23
IPC: H04H60/04
CPC classification number: G10L19/0019 , G10L19/00 , G10L19/008 , G11B27/034 , G11B27/32 , H04H60/04
Abstract: 提供了一种产生和播放基于对象的音频内容的方法以及一种用于存储具有用于基于对象的音频服务的文件格式结构的数据的计算机可读记录介质,所述基于对象的音频内容可有效地存储与基于对象的音频内容有关的预设信息。产生基于对象的音频内容的方法可包括:接收多个音频对象(310);通过使用所述多个音频对象产生至少一个预设(320);存储关于所述至少一个预设的属性和所述多个音频对象的预设参数(330)。可以以框的形式存储预设参数,以与基于对象的音频内容有关的媒体文件格式定义所述框。由此,可有效地存储关于多个音频对象的预设。
-
-
公开(公告)号:CN118355663A
公开(公告)日:2024-07-16
申请号:CN202280079273.2
申请日:2022-09-30
Applicant: 韩国电子通信研究院 , 淑明女子大学校产学协力团
IPC: H04N19/577 , H04N19/176 , H04N19/70 , H04N19/109 , G06T9/00 , G06N3/08
Abstract: 本文公开了一种用于图像编码/解码的方法、设备和存储介质。确定目标块的预测信息,并且使用预测信息对目标块执行预测。对于预测,可使用多个双向预测方法,并且双向预测方法可包括基于神经网络的双向预测。作为基于神经网络的双向预测的输入,可使用多个中间预测块,并且可通过基于神经网络的双向预测输出最终预测块。可基于目标块的属性和编码参数来执行基于神经网络的双向预测。
-
公开(公告)号:CN110895943B
公开(公告)日:2023-10-20
申请号:CN201911107604.5
申请日:2015-07-01
Applicant: 韩国电子通信研究院
IPC: G10L19/008
Abstract: 公开了一种处理多信道音频信号的方法和装置。所述方法包括:识别从N信道的输入信号生成的N/2信道的下混信号和N/2残余信号;通过将N/2信道的下混信号和N/2残余信号应用到预去相关器矩阵来生成第一信号和第二信号;将第一信号应用到混合矩阵,其中不基于去相关器对第一信号进行去相关;将第二信号应用到去相关器并且将去相关的第二信号应用到混合矩阵;以及基于将第一信号和去相关的第二信号应用到混合矩阵的结果,输出N信道的输出信号。
-
公开(公告)号:CN110992964B
公开(公告)日:2023-10-13
申请号:CN201911107595.X
申请日:2015-07-01
Applicant: 韩国电子通信研究院
IPC: G10L19/008 , G10L19/02
Abstract: 公开了一种处理多信道音频信号的方法和装置。所述方法包括:识别从N信道的输入信号生成的N/2信道的下混信号和N/2残余信号;通过将所述N/2信道的下混信号和残余信号应用到预去相关器矩阵来输出第一信号和第二信号;以及通过将没有通过去相关器进行去相关的第一信号应用到混合矩阵,并将从去相关器输出的去相关的第二信号应用到混合矩阵,来输出N信道的输出信号。
-
公开(公告)号:CN116018640A
公开(公告)日:2023-04-25
申请号:CN202180047761.0
申请日:2021-07-02
Applicant: 韩国电子通信研究院
IPC: G10L19/00
Abstract: 公开了一种用于音频编码/解码的设备和方法,其对过渡部分中的编码失真具有鲁棒性。一种音频编码方法包括:通过对输入信号进行时间到频率(T/F)变换来输出频域信号;输出频域残差信号,在该频域残差信号中,通过对频域信号应用频域噪声整形(FDNS)编码从频域信号中去除了频率轴包络;输出时域残差信号,在该时域残差信号中,通过基于频域残差信号执行线性预测系数(LPC)解析去除了时间轴包络;以及量化并发送时域残差信号。
-
-
-
-
-
-
-
-
-