一种3D图像空间与3D视听空间转换方法及装置

    公开(公告)号:CN103458262B

    公开(公告)日:2015-07-29

    申请号:CN201310438138.5

    申请日:2013-09-24

    Applicant: 武汉大学

    Abstract: 本发明提供了一种3D图像空间与3D视听空间转换方法及装置,包括目将图像坐标系内中心点的位置和目标对象的位置作为输入,得到目标对象相对于中心点的方位信息,映射得到目标对象相对于中心点在视听坐标系中的方位信息;从3D视频中提取出目标对象的深度值和中心点的深度值,计算出目标对象与中心点的深度差,转换得到以物理单位为度量的目标对象相对于中心点的距离信息;还原出目标对象在视听坐标系中的目标位置。本发明创造性提出图像空间转3D视听空间的方案,在图像空间中获取目标对象的方位信息和3D视频中获取目标对象的距离信息,然后在视听空间中还原声像的目标位置,重建目标对象方位信息。

    一种三维多声道音频系统扬声器组精简布设方法

    公开(公告)号:CN102883246A

    公开(公告)日:2013-01-16

    申请号:CN201210408900.0

    申请日:2012-10-24

    Applicant: 武汉大学

    Abstract: 一种三维多声道音频系统扬声器组精简布设方法,包括采集精简前三维n声道音频系统中各个扬声器的空间位置信息,分析球面三角形扬声器组的所有组合并挑选仅包含单个扬声器的球面三角形扬声器组,剔除球面三角形面积最小的扬声器组所包含的单个扬声器,判断当前待精简扬声器数是否大于m,若大于m,继续执行简化过程,否则结束迭代,直到等于m,得到m声道精简系统扬声器组最优空间位置排布。采用本发明提供技术方案可以保证精简过程不影响听音中心点处的声音的物理特性。

    3D音频中水平方位参数的编解码性能评价方法

    公开(公告)号:CN102867518A

    公开(公告)日:2013-01-09

    申请号:CN201210333506.5

    申请日:2012-09-10

    Applicant: 武汉大学

    Abstract: 本发明提出了一种3D音频中水平方位参数的编码性能评价方法。本发明方法将水平方位参数及其JND值引入统计学失真测度中构建主观感知失真测度,利用所构建的主观感知失真测度进行3D音频中水平方位参数的编解码性能评价。本发明方法将水平方位参数的JND看作统计意义上人耳能忍受的水平方位偏差,引入统计学失真测度构建主观感知失真测度,从而进行编解码性能的评价指标。本发明方法能保证3D音频编码的评价结果与人耳主观感知更加一致,使3D音频编解码效果更符合人耳主观感知特性,从而提高编解码技术的主观性能。

    一种立体声系统中恢复声源方位信息的方法与装置

    公开(公告)号:CN103347245B

    公开(公告)日:2015-03-25

    申请号:CN201310273067.8

    申请日:2013-07-01

    Applicant: 武汉大学

    Abstract: 本发明公开了一种立体声系统中恢复声源方位信息的方法与装置,装置包括声学属性计算模块,信号预分配模块,重建声场声学属性计算模块,声学属性匹配模块,增益确定模块,信号分配模块。通过在原声场中获得听音点处的粒子速度,在重建声场中,通过左、右两路独立的放音通道进行立体声重放,对重建声场中的两个扬声器预分配信号,根据立体声系统产生的听音点处的粒子速度与原声场中听音点处的粒子速度一致性,建立声像方位恢复模型,得到扬声器信号的加权因子,然后对每个扬声器分配相应的信号,即可完成原声场的重建。本发明能够准确的恢复原声场中的声像方位信息,并且操作简单,稳定性高。

    一种三维多声道音频系统扬声器组精简布设方法

    公开(公告)号:CN102883246B

    公开(公告)日:2014-10-22

    申请号:CN201210408900.0

    申请日:2012-10-24

    Applicant: 武汉大学

    Abstract: 一种三维多声道音频系统扬声器组精简布设方法,包括采集精简前三维n声道音频系统中各个扬声器的空间位置信息,分析球面三角形扬声器组的所有组合并挑选仅包含单个扬声器的球面三角形扬声器组,剔除球面三角形面积最小的扬声器组所包含的单个扬声器,判断当前待精简扬声器数是否大于m,若大于m,继续执行简化过程,否则结束迭代,直到等于m,得到m声道精简系统扬声器组最优空间位置排布。采用本发明提供技术方案可以保证精简过程不影响听音中心点处的声音的物理特性。

    一种三维多声道音频系统扬声器组折半精简方法

    公开(公告)号:CN103220601A

    公开(公告)日:2013-07-24

    申请号:CN201310141790.0

    申请日:2013-04-22

    Applicant: 武汉大学

    Abstract: 一种三维多声道音频系统扬声器组折半精简方法,根据原始扬声器排布镜像对称,通过折半法将三维n声道音频系统中n个扬声器精简为三维m声道音频系统中的m个扬声器,包括获取折半精简前三维n声道音频系统中各个扬声器的空间位置信息;通过对称面对精简前三维n声道音频系统中扬声器折半,获得初始的待精简对象;对扬声器作镜像分配;分析待精简对象中三角形扬声器组的所有组合,分析得到应被精简的扬声器并剔除;剔除上述被精简扬声器的镜像点,判断当前待精简扬声器数sum是否大于m,若大于m,继续执行简化过程,否则结束迭代,得到m声道精简系统扬声器组最优空间位置排布。

    一种3D图像空间与3D视听空间转换方法及装置

    公开(公告)号:CN103458262A

    公开(公告)日:2013-12-18

    申请号:CN201310438138.5

    申请日:2013-09-24

    Applicant: 武汉大学

    Abstract: 本发明提供了一种3D图像空间与3D视听空间转换方法及装置,包括目将图像坐标系内中心点的位置和目标对象的位置作为输入,得到目标对象相对于中心点的方位信息,映射得到目标对象相对于中心点在视听坐标系中的方位信息;从3D视频中提取出目标对象的深度值和中心点的深度值,计算出目标对象与中心点的深度差,转换得到以物理单位为度量的目标对象相对于中心点的距离信息;还原出目标对象在视听坐标系中的目标位置。本发明创造性提出图像空间转3D视听空间的方案,在图像空间中获取目标对象的方位信息和3D视频中获取目标对象的距离信息,然后在视听空间中还原声像的目标位置,重建目标对象方位信息。

    面向多声道三维音频的编解码方法与系统

    公开(公告)号:CN103400582A

    公开(公告)日:2013-11-20

    申请号:CN201310351242.0

    申请日:2013-08-13

    Applicant: 武汉大学

    Abstract: 本发明公开了一种面向多声道三维音频的编解码方法与系统,包括时频变换模块、子带划分模块、子带能量计算模块、变换模块,子带能量还原模块、子带合成模块和频时变换模块。编码端,将输入声道的时域信号变换为频域信号,并将各声道的频域信号信号划分为子带,计算各子带能量;将相邻三个声道对应的子带能量组合成声道单元,分析声道单元中各子带能量并根据分析结果选择变换矩阵;在解码端,通过变换矩阵索引,还原声道单元,并获得各声道的频域信号,通过频时变换得到各声道的域信号,从而最大无失真地完成了原始声道信号的还原。本发明可实现声道间冗余信息的去除,且具有低复杂度和高效率的特点,适用于三维音频直播通信传输的要求。

    面向多声道三维音频的编解码方法与系统

    公开(公告)号:CN103400582B

    公开(公告)日:2015-09-16

    申请号:CN201310351242.0

    申请日:2013-08-13

    Applicant: 武汉大学

    Abstract: 本发明公开了一种面向多声道三维音频的编解码方法与系统,包括时频变换模块、子带划分模块、子带能量计算模块、变换模块,子带能量还原模块、子带合成模块和频时变换模块。编码端,将输入声道的时域信号变换为频域信号,并将各声道的频域信号信号划分为子带,计算各子带能量;将相邻三个声道对应的子带能量组合成声道单元,分析声道单元中各子带能量并根据分析结果选择变换矩阵;在解码端,通过变换矩阵索引,还原声道单元,并获得各声道的频域信号,通过频时变换得到各声道的域信号,从而最大无失真地完成了原始声道信号的还原。本发明可实现声道间冗余信息的去除,且具有低复杂度和高效率的特点,适用于三维音频直播通信传输的要求。

Patent Agency Ranking