-
公开(公告)号:CN101408614B
公开(公告)日:2011-09-14
申请号:CN200810197889.1
申请日:2008-11-26
Applicant: 武汉大学
Abstract: 在空间音频编码中,双耳声强差是听觉系统辨别声源方位的重要参数之一。本发明公开了双耳声强差(以下简称ILD)参数的临界感知特性的测量方法:对测试源采用巴克频带的划分规则,选取各巴克频带的中心频率作为原始音频率,同时原始音保持声压级恒定;接着依据ILD的感知原理,通过等间距或非线性变化ILD值的方法制作听音位置渐变的测试音;最后通过主观测试的方法,获取ILD参数的临界感知值JND。本发明实现了频率从20Hz至20KHz信号的ILD临界感知特性的定量分析,解决了传统ILD特性分析中仅有定性描述的缺陷,以及空间音频编码中ILD参数的主观冗余去除的问题,利于优化分析。
-
公开(公告)号:CN101499279A
公开(公告)日:2009-08-05
申请号:CN200910060983.7
申请日:2009-03-06
Applicant: 武汉大学
Abstract: 空间参数是用来表达人耳感知声场效果的空间信息,空间参数的比特分配是空间音频编码的核心技术之一。本发明公开了空间参数逐级精细的比特分配方法:首先对输入信号进行分帧处理,经过时频变换后再将每帧信号按巴克带规则划分频带,选取比特分配模式。然后按照选取的分配模式分别对帧间、帧内和频带内各参数进行比特分配,实现逐级精细的空间参数比特分配,并在此基础上设计应用装置。本发明将更多的比特分配给人耳感知信息量最多最敏感的部分,而将较少的比特分配给人耳感知不敏感的部分,最终在保证透明音质的前提下达到有效提高编码效率的目的。
-
公开(公告)号:CN101408615A
公开(公告)日:2009-04-15
申请号:CN200810197890.4
申请日:2008-11-26
Applicant: 武汉大学
Abstract: 在空间音频编码中,双耳时间差是听觉系统辨别声源方位的重要参数之一。本发明公开了双耳时间差(以下简称ITD)参数的临界感知特性的测量方法:对测试源采用巴克频带的划分规则,选取各巴克频带的中心频率作为原始音频率,同时原始音保持声压级恒定;接着依据ITD的感知原理,通过等间距或非线性变化ITD值的方法制作听音位置渐变的测试音;最后通过主观测试的方法,获取ITD参数的临界感知值JND。本发明实现了频率从20Hz至20KHz信号的ITD临界感知特性的定量分析,解决了传统ITD特性分析中仅有定性描述的缺陷,以及空间音频编码中ITD参数的主观冗余去除的问题,利于优化分析。
-
公开(公告)号:CN101188878A
公开(公告)日:2008-05-28
申请号:CN200710168614.0
申请日:2007-12-05
Applicant: 武汉大学
Abstract: 本发明公开了一种立体声音频信号的空间参数量化及熵编码方法及其所用系统结构,首先将立体声音频信号的空间参数的量化在不同的频带使用不同的量化表,通过查表进行非线性的标量量化,然后将得到的各个空间参数的量化指标组合成一个向量,并与上一帧的量化指标向量差分,最后根据当前频带对应的Huffman码表将得到差分量化指标向量进行Huffman熵编码。本发明利用空间参数听觉感知与频带的依赖关系以及空间参数间的相关性,有效去除空间参数的主观和客观冗余,可以在同样的编码码率下提高空间参数立体声编码的音质,或者在同样的编码音质下,降低编码码率。
-
公开(公告)号:CN101419801B
公开(公告)日:2011-08-17
申请号:CN200810236646.4
申请日:2008-12-03
Applicant: 武汉大学
IPC: G10L19/00
Abstract: 本发明公开了一种分频带测量耳间相关度感知特性的方法及其装置。在空间音频编码中,耳间相关度是一个控制声场宽度的重要参数。本发明采用等响度、分频带分析的方法,测试人耳对耳间相关度参数的感知特性。并以此为基础,各频带独自判断,是否需要提取耳间相关度参数参与编码,相比较于全频带提取或全频带不提取的现有方法,本发明有效的去除了耳间相关度的主观冗余,提升了这一参数的编码效率。
-
公开(公告)号:CN101030380B
公开(公告)日:2011-05-11
申请号:CN200710051713.0
申请日:2007-03-22
Applicant: 武汉大学
IPC: G10L19/12
Abstract: 本发明涉及码激励线性预测语音编码器的分数基音估计方法,通过多项式插值直接估计峰值位置获得分数基音估计,分数基音估计值通过以下步骤获取,(1)首先对目标信号进行开环基音估计,计算开环整数基音估计值Top;(2)接着进行开环基音估计,在开环整数基音估计值Top的给定邻域内计算闭环相关序列C(k);(3)如果闭环相关序列C(k)的峰值点Tcl出现在给定邻域的两端,则分数基音估计值Tfr为零值;如果峰值点Tcl出现在给定邻域内,则根据峰值点Tcl及其前一点Tcl-1、后一点Tcl+1的值进行多项式拟合,求得峰值位置Tr,对峰值位置Tr按插值因子D进行线性量化,得到分数基音估计值Tfr,线性量化公式为Tfr=round(Tr*D)。本发明在获得精确分数基音估计值、提高预测增益的前提下,有效降低了运算复杂度和系统开销。
-
公开(公告)号:CN100571043C
公开(公告)日:2009-12-16
申请号:CN200710053770.2
申请日:2007-11-06
Applicant: 武汉大学
Abstract: 本发明公开了空间参数立体声编解码方法及装置:编码端首先将立体声左右声道信号在时域或频域下混,然后下混信号传送到变换编码器产生单声道编码数据,同时提取包含量化误差的下混信号,并根据其短时频谱特性将其变换域划分为连续且不重叠的子带,以子带为单位提取左右声道的空间参数。解码端根据变换编码数据,生成与编码端一致的包含量化误差的下混信号并采用同样的划分方法得到子带划分,然后根据空间参数信息重建立体声左右声道子带信号,反变换输出时域立体声信号。与现有技术相比,本发明没有正反变换带来的附加延时并且可在不传送子带划分信息的条件下实现动态的时频划分,提高了空间参数立体声编解码的实时性和效率。
-
公开(公告)号:CN101552006A
公开(公告)日:2009-10-07
申请号:CN200910062028.7
申请日:2009-05-12
Applicant: 武汉大学
Abstract: 本发明提出了加窗信号在MDCT域的能量及相位调整方法及其装置,通过加窗信号的MDCT谱和MDST谱,构造加窗信号的CMCLT谱;根据加窗信号的CMCLT谱,提取加窗信号在CMCLT域的能量信息和相位信息,然后根据所得能量信息及相位信息,在MDCT域上提取空间参数。所述CMCLT谱是共轭调制复重叠变换谱,是以变换时所用窗函数为共轭窗函数的MDCT谱和MDST谱分别作为实部和虚部,从而定义MDCT的一种复数化扩展形式。应用本发明可统一空间音频编码系统中的时频分析工具,有效提取多声道信号的空间参数。统一时频变换工具后,整个编码端只需进行一次时频变换,较大幅度降低了空间音频编解码系统的复杂度,从而优化编解码工作。
-
公开(公告)号:CN101504835A
公开(公告)日:2009-08-12
申请号:CN200910061011.X
申请日:2009-03-09
Applicant: 武汉大学
Abstract: 本发明公开了一种声场中空间感知信息量的度量方法及应用,该方法以空间感知熵SPE代表一个多声道音频信号中可以被感知到的空间信息量的大小,即表达双耳听音中人耳接收到的空间感知信息量的大小。以双耳听音模型为基础的SPE代表了一个多声道音频信号中可以被感知到的空间信息量的大小,是空间音频编码码率的下限,解决了以单耳听音模型为基础计算的感知熵无法度量声场中空间感知信息量的问题。
-
公开(公告)号:CN101499280A
公开(公告)日:2009-08-05
申请号:CN200910061028.5
申请日:2009-03-09
Applicant: 武汉大学
Abstract: 本发明提出了基于空间感知熵判决的空间参数选取方法及其装置,通过比较相邻频带空间参数临界感知阈值大小进行空间参数的预选取,并以实际信号的空间感知熵及其波动度的大小对预选取结果进行修正,实现低复杂度高效的空间参数选取。本发明能够优化空间参数选取,实现高效的空间音频编码。
-
-
-
-
-
-
-
-
-