-
公开(公告)号:CN102708872B
公开(公告)日:2013-08-21
申请号:CN201210190527.6
申请日:2012-06-11
Applicant: 武汉大学
IPC: G10L19/038 , G10L19/107
Abstract: 本发明公开了一种3D音频中水平方位参数码本获取方法,包括步骤:S1、确定所需码本中码字个数n和每个码字的维数D;S2、将水平方位参数训练集中的水平方位参数分割为D维矢量得到训练矢量集,并将前n个矢量组成n个D维临时码本;S3、将训练矢量集中的矢量划分为n个胞腔;S4、计算主观平均失真Dsp,比较主观平均失真Dsp和预先设定的门限误差ε的大小,若Dsp
-
-
公开(公告)号:CN102760442B
公开(公告)日:2014-09-03
申请号:CN201210256992.5
申请日:2012-07-24
Applicant: 武汉大学
IPC: G10L19/032
Abstract: 本发明提出一种3D音频中水平方位参数量化方法,考虑了人耳在不同频带的感知能力,引入了人耳可感知的最小差异JND值;在量化客观失真的基础上,将其与JND值进行结合运算得到主观感知失真,以此为依据选出最符合人耳感知特性的码字作为量化结果。利用这种技术方案进行量化,量化结果的人耳主观感知性能较好。
-
公开(公告)号:CN103400582A
公开(公告)日:2013-11-20
申请号:CN201310351242.0
申请日:2013-08-13
Applicant: 武汉大学
IPC: G10L19/008
Abstract: 本发明公开了一种面向多声道三维音频的编解码方法与系统,包括时频变换模块、子带划分模块、子带能量计算模块、变换模块,子带能量还原模块、子带合成模块和频时变换模块。编码端,将输入声道的时域信号变换为频域信号,并将各声道的频域信号信号划分为子带,计算各子带能量;将相邻三个声道对应的子带能量组合成声道单元,分析声道单元中各子带能量并根据分析结果选择变换矩阵;在解码端,通过变换矩阵索引,还原声道单元,并获得各声道的频域信号,通过频时变换得到各声道的域信号,从而最大无失真地完成了原始声道信号的还原。本发明可实现声道间冗余信息的去除,且具有低复杂度和高效率的特点,适用于三维音频直播通信传输的要求。
-
公开(公告)号:CN102708872A
公开(公告)日:2012-10-03
申请号:CN201210190527.6
申请日:2012-06-11
Applicant: 武汉大学
Abstract: 本发明公开了一种3D音频中水平方位参数码本获取方法,包括步骤:S1、确定所需码本中码字个数n和每个码字的维数D;S2、将水平方位参数训练集中的水平方位参数分割为D维矢量得到训练矢量集,并将前n个矢量组成n个D维临时码本;S3、将训练矢量集中的矢量划分为n个胞腔;S4、计算主观平均失真Dsp,比较主观平均失真Dsp和预先设定的门限误差ε的大小,若Dsp
-
公开(公告)号:CN103400582B
公开(公告)日:2015-09-16
申请号:CN201310351242.0
申请日:2013-08-13
Applicant: 武汉大学
IPC: G10L19/008
Abstract: 本发明公开了一种面向多声道三维音频的编解码方法与系统,包括时频变换模块、子带划分模块、子带能量计算模块、变换模块,子带能量还原模块、子带合成模块和频时变换模块。编码端,将输入声道的时域信号变换为频域信号,并将各声道的频域信号信号划分为子带,计算各子带能量;将相邻三个声道对应的子带能量组合成声道单元,分析声道单元中各子带能量并根据分析结果选择变换矩阵;在解码端,通过变换矩阵索引,还原声道单元,并获得各声道的频域信号,通过频时变换得到各声道的域信号,从而最大无失真地完成了原始声道信号的还原。本发明可实现声道间冗余信息的去除,且具有低复杂度和高效率的特点,适用于三维音频直播通信传输的要求。
-
公开(公告)号:CN102867518B
公开(公告)日:2014-07-02
申请号:CN201210333506.5
申请日:2012-09-10
Applicant: 武汉大学
Abstract: 本发明提出了一种3D音频中水平方位参数的编码性能评价方法。本发明方法将水平方位参数及其JND值引入统计学失真测度中构建主观感知失真测度,利用所构建的主观感知失真测度进行3D音频中水平方位参数的编解码性能评价。本发明方法将水平方位参数的JND看作统计意义上人耳能忍受的水平方位偏差,引入统计学失真测度构建主观感知失真测度,从而进行编解码性能的评价指标。本发明方法能保证3D音频编码的评价结果与人耳主观感知更加一致,使3D音频编解码效果更符合人耳主观感知特性,从而提高编解码技术的主观性能。
-
公开(公告)号:CN103065634A
公开(公告)日:2013-04-24
申请号:CN201210558954.5
申请日:2012-12-20
Applicant: 武汉大学
IPC: G10L19/008 , H04S3/00
Abstract: 目前三维音频信号大多在本地存储和播放,一般没有对其进行编码压缩或仅仅对每个声道单独编码,码率会随声道数呈线性增长,音频文件数据量就会非常大。通过参数化的编码方法能大幅提高压缩比,然而空间信息码率也会随着声道数的增加而线性增长,如果码率受到实时转播带宽和存储媒介容量限制的情况下,参数量化误差会导致三维音频的空间方位感失真,三维音频的重建效果会显著下降。本发明提供一种基于感知特性的三维音频空间参数的量化方法,针对这些问题,通过获取不同方位的感知阈值,生成了非均匀的量化表,相对于传统的均匀量化表有效减低参数的编码码率。
-
公开(公告)号:CN103065634B
公开(公告)日:2014-11-19
申请号:CN201210558954.5
申请日:2012-12-20
Applicant: 武汉大学
IPC: G10L19/008 , H04S3/00
Abstract: 目前三维音频信号大多在本地存储和播放,一般没有对其进行编码压缩或仅仅对每个声道单独编码,码率会随声道数呈线性增长,音频文件数据量就会非常大。通过参数化的编码方法能大幅提高压缩比,然而空间信息码率也会随着声道数的增加而线性增长,如果码率受到实时转播带宽和存储媒介容量限制的情况下,参数量化误差会导致三维音频的空间方位感失真,三维音频的重建效果会显著下降。本发明提供一种基于感知特性的三维音频空间参数的量化方法,针对这些问题,通过获取不同方位的感知阈值,生成了非均匀的量化表,相对于传统的均匀量化表有效减低参数的编码码率。
-
公开(公告)号:CN102867518A
公开(公告)日:2013-01-09
申请号:CN201210333506.5
申请日:2012-09-10
Applicant: 武汉大学
Abstract: 本发明提出了一种3D音频中水平方位参数的编码性能评价方法。本发明方法将水平方位参数及其JND值引入统计学失真测度中构建主观感知失真测度,利用所构建的主观感知失真测度进行3D音频中水平方位参数的编解码性能评价。本发明方法将水平方位参数的JND看作统计意义上人耳能忍受的水平方位偏差,引入统计学失真测度构建主观感知失真测度,从而进行编解码性能的评价指标。本发明方法能保证3D音频编码的评价结果与人耳主观感知更加一致,使3D音频编解码效果更符合人耳主观感知特性,从而提高编解码技术的主观性能。
-
-
-
-
-
-
-
-
-