-
公开(公告)号:CN101552006A
公开(公告)日:2009-10-07
申请号:CN200910062028.7
申请日:2009-05-12
Applicant: 武汉大学
Abstract: 本发明提出了加窗信号在MDCT域的能量及相位调整方法及其装置,通过加窗信号的MDCT谱和MDST谱,构造加窗信号的CMCLT谱;根据加窗信号的CMCLT谱,提取加窗信号在CMCLT域的能量信息和相位信息,然后根据所得能量信息及相位信息,在MDCT域上提取空间参数。所述CMCLT谱是共轭调制复重叠变换谱,是以变换时所用窗函数为共轭窗函数的MDCT谱和MDST谱分别作为实部和虚部,从而定义MDCT的一种复数化扩展形式。应用本发明可统一空间音频编码系统中的时频分析工具,有效提取多声道信号的空间参数。统一时频变换工具后,整个编码端只需进行一次时频变换,较大幅度降低了空间音频编解码系统的复杂度,从而优化编解码工作。
-
公开(公告)号:CN101504835A
公开(公告)日:2009-08-12
申请号:CN200910061011.X
申请日:2009-03-09
Applicant: 武汉大学
Abstract: 本发明公开了一种声场中空间感知信息量的度量方法及应用,该方法以空间感知熵SPE代表一个多声道音频信号中可以被感知到的空间信息量的大小,即表达双耳听音中人耳接收到的空间感知信息量的大小。以双耳听音模型为基础的SPE代表了一个多声道音频信号中可以被感知到的空间信息量的大小,是空间音频编码码率的下限,解决了以单耳听音模型为基础计算的感知熵无法度量声场中空间感知信息量的问题。
-
公开(公告)号:CN101499280A
公开(公告)日:2009-08-05
申请号:CN200910061028.5
申请日:2009-03-09
Applicant: 武汉大学
Abstract: 本发明提出了基于空间感知熵判决的空间参数选取方法及其装置,通过比较相邻频带空间参数临界感知阈值大小进行空间参数的预选取,并以实际信号的空间感知熵及其波动度的大小对预选取结果进行修正,实现低复杂度高效的空间参数选取。本发明能够优化空间参数选取,实现高效的空间音频编码。
-
公开(公告)号:CN101521012B
公开(公告)日:2011-12-28
申请号:CN200910061439.4
申请日:2009-04-08
Applicant: 武汉大学
IPC: G10L19/00
Abstract: 本发明提出了MDCT域信号能量与相位补偿方法及其装置,通过分析MDCT变换基和MDST变换基之间的关系,利用稀疏化近似矩阵,提取并简化MDCT至MDST的转换矩阵;利用转换矩阵实现MDCT谱至MDST谱的转换,并联合两者构造具有恒定能量及线性相位的MDFT谱;依据MDFT谱提取空间参数。本发明有效解决了信号在MDCT域的能量抖动及相位缺失问题,实现了在空间音频编码系统中低复杂度的MDCT域空间参数提取合成。
-
公开(公告)号:CN101552006B
公开(公告)日:2011-12-28
申请号:CN200910062028.7
申请日:2009-05-12
Applicant: 武汉大学
Abstract: 本发明提出了加窗信号在MDCT域的能量及相位调整方法及其装置,通过加窗信号的MDCT谱和MDST谱,构造加窗信号的CMCLT谱;根据加窗信号的CMCLT谱,提取加窗信号在CMCLT域的能量信息和相位信息,然后根据所得能量信息及相位信息,在MDCT域上提取空间参数。所述CMCLT谱是共轭调制复重叠变换谱,是以变换时所用窗函数为共轭窗函数的MDCT谱和MDST谱分别作为实部和虚部,从而定义MDCT的一种复数化扩展形式。应用本发明可统一空间音频编码系统中的时频分析工具,有效提取多声道信号的空间参数。统一时频变换工具后,整个编码端只需进行一次时频变换,较大幅度降低了空间音频编解码系统的复杂度,从而优化编解码工作。
-
公开(公告)号:CN101499280B
公开(公告)日:2011-11-02
申请号:CN200910061028.5
申请日:2009-03-09
Applicant: 武汉大学
Abstract: 本发明提出了基于空间感知熵判决的空间参数选取方法及其装置,通过比较相邻频带空间参数临界感知阈值大小进行空间参数的预选取,并以实际信号的空间感知熵及其波动度的大小对预选取结果进行修正,实现低复杂度高效的空间参数选取。本发明能够优化空间参数选取,实现高效的空间音频编码。
-
公开(公告)号:CN101499279B
公开(公告)日:2011-11-02
申请号:CN200910060983.7
申请日:2009-03-06
Applicant: 武汉大学
Abstract: 空间参数是用来表达人耳感知声场效果的空间信息,空间参数的比特分配是空间音频编码的核心技术之一。本发明公开了空间参数逐级精细的比特分配方法:首先对输入信号进行分帧处理,经过时频变换后再将每帧信号按巴克带规则划分频带,选取比特分配模式。然后按照选取的分配模式分别对帧间、帧内和频带内各参数进行比特分配,实现逐级精细的空间参数比特分配,并在此基础上设计应用装置。本发明将更多的比特分配给人耳感知信息量最多最敏感的部分,而将较少的比特分配给人耳感知不敏感的部分,最终在保证透明音质的前提下达到有效提高编码效率的目的。
-
公开(公告)号:CN101800050A
公开(公告)日:2010-08-11
申请号:CN201010107402.3
申请日:2010-02-03
Applicant: 武汉大学
IPC: G10L19/02
Abstract: 本发明涉及音频编码技术领域,尤其涉及一种基于感知自适应比特分配的音频精细分级编码方法及系统。本发明方法对输入信号进行预处理、对频域信号进行子带划分、计算每个子带的感知重要度,并根据感知重要度按照从大到小的顺序统一对子带排序,提取感知重要度最大的子带、进行可分级纵向矢量量化、对矢量量化后的最大重要感知重要度子带进行自适应调整;本发明系统包括预处理模块、子带划分模块、子带感知重要度计算排序及提取模块、分级量化编码模块、自适应调整模块、分级编码结束判断模块。本发明实现了高效的精细可分级音频编码,较好地实现了量化精度和量化效率的统一,提高编码效率的同时也满足了高音质的需求。
-
公开(公告)号:CN101504835B
公开(公告)日:2011-11-16
申请号:CN200910061011.X
申请日:2009-03-09
Applicant: 武汉大学
Abstract: 本发明公开了一种声场中空间感知信息量的度量方法及应用,该方法以空间感知熵SPE代表一个多声道音频信号中可以被感知到的空间信息量的大小,即表达双耳听音中人耳接收到的空间感知信息量的大小。以双耳听音模型为基础的SPE代表了一个多声道音频信号中可以被感知到的空间信息量的大小,是空间音频编码码率的下限,解决了以单耳听音模型为基础计算的感知熵无法度量声场中空间感知信息量的问题。
-
公开(公告)号:CN101521012A
公开(公告)日:2009-09-02
申请号:CN200910061439.4
申请日:2009-04-08
Applicant: 武汉大学
IPC: G10L19/00
Abstract: 本发明提出了MDCT域信号能量与相位补偿方法及其装置,通过分析MDCT变换基和MDST变换基之间的关系,利用稀疏化近似矩阵,提取并简化MDCT至MDST的转换矩阵;利用转换矩阵实现MDCT谱至MDST谱的转换,并联合两者构造具有恒定能量及线性相位的MDFT谱;依据MDFT谱提取空间参数。本发明有效解决了信号在MDCT域的能量抖动及相位缺失问题,实现了在空间音频编码系统中低复杂度的MDCT域空间参数提取合成。
-
-
-
-
-
-
-
-
-