处理基于对象的音频信号
    11.
    发明授权

    公开(公告)号:CN106385660B

    公开(公告)日:2020-10-16

    申请号:CN201510484949.8

    申请日:2015-08-07

    Abstract: 本文公开的示例实施例涉及音频信号处理。音频信号具有多个音频对象。公开了一种处理音频信号的方法。该方法包括获取针对每个音频对象的对象位置;以及基于对象位置、多个对象至簇增益以及度量标准的集合,确定用于将音频对象分组成簇的簇位置。度量标准指示簇位置的质量以及对象至簇增益的质量,簇位置中的每个簇位置是簇的相应的一个簇的质心,并且对象至簇增益中的一个增益定义相应的音频对象在一个簇中的比率。该方法还包括基于对象位置、簇位置和度量标准的集合,确定对象至簇增益;以及基于所确定的簇位置和对象至簇增益,生成簇信号。还公开了相应的系统和计算机程序产品。

    使用音频对象的时间变化的音频对象聚类

    公开(公告)号:CN104882145B

    公开(公告)日:2019-10-29

    申请号:CN201410078314.3

    申请日:2014-02-28

    Abstract: 本发明的实施例涉及使用音频对象的时间变化的音频对象聚类。提供一种用于在音频对象聚类中使用音频对象的时间变化的方法。该方法包括:获取与所述音频对象相关联的音轨的至少一个片段,所述至少一个片段包含所述音频对象;基于所述音频对象的至少一个属性,估计所述音频对象在所述至少一个片段的持续时间上的变化;以及至少部分地基于估计的所述变化,调整所述音频对象在所述音频对象聚类中对聚类中心的确定的贡献。还公开了相应的系统和计算机程序产品。

    使用音频对象的时间变化的音频对象聚类

    公开(公告)号:CN104882145A

    公开(公告)日:2015-09-02

    申请号:CN201410078314.3

    申请日:2014-02-28

    Abstract: 本发明的实施例涉及使用音频对象的时间变化的音频对象聚类。提供一种用于在音频对象聚类中使用音频对象的时间变化的方法。该方法包括:获取与所述音频对象相关联的音轨的至少一个片段,所述至少一个片段包含所述音频对象;基于所述音频对象的至少一个属性,估计所述音频对象在所述至少一个片段的持续时间上的变化;以及至少部分地基于估计的所述变化,调整所述音频对象在所述音频对象聚类中对聚类中心的确定的贡献。还公开了相应的系统和计算机程序产品。

    元数据保留的音频对象聚类

    公开(公告)号:CN112954580A

    公开(公告)日:2021-06-11

    申请号:CN202011623482.8

    申请日:2014-12-11

    Abstract: 本发明的实施例涉及元数据保留的音频对象聚类。公开了一种用于元数据保留的音频对象聚类的方法。该方法包括基于与多个音频对象相关联的元数据中的待保留信息,将多个音频对象分类到多个类别中。该方法还包括将预定数目的簇指派给类别,以及根据指派来将这些类别中的每个类别中的音频对象分配到簇中的至少一个簇。还公开了相应的系统和计算机程序产品。

    利用子带对象概率估计的音频对象提取

    公开(公告)号:CN105336335B

    公开(公告)日:2020-12-08

    申请号:CN201410372867.X

    申请日:2014-07-25

    Inventor: 陈连武 芦烈

    Abstract: 本发明的实施例涉及音频对象提取。公开了一种用于从音频内容中提取音频对象的方法。该方法包括为所述音频内容的帧中的子带音频信号确定子带对象概率,所述子带对象概率指示所述子带音频信号包含音频对象的概率。该方法进一步包括基于确定的子带对象概率,将所述子带音频信号分割为音频对象部分和残余音频部分。还公开了相应的系统和计算机程序产品。

    音频信号的上混音
    16.
    发明公开

    公开(公告)号:CN105992120A

    公开(公告)日:2016-10-05

    申请号:CN201510066647.9

    申请日:2015-02-09

    Abstract: 本发明的实施例涉及音频信号的上混音。描述了一种对音频信号进行上混音的方法。该方法包括:将所述音频信号分解成扩散信号和直达信号;至少部分地基于扩散信号,生成音频静态环境声,音频静态环境声包括高度声道;从直达信号中提取音频对象;估计音频对象的元数据,元数据包括音频对象的高度信息;以及将音频静态环境声和音频对象呈现为经过上混音的音频信号,其中音频静态环境声被呈现到预定义的位置并且音频对象根据元数据而被呈现。还公开了相应的系统和计算机程序产品。

    从音频内容基于投影提取音频对象

    公开(公告)号:CN105898667A

    公开(公告)日:2016-08-24

    申请号:CN201410814973.9

    申请日:2014-12-22

    Abstract: 本发明的实施方式涉及音频对象提取。公开了一种用于从音频内容中提取音频对象的方法。该方法包括标识第一投影空间集合,所述第一投影空间集合包括用于所述多个声道中的第一声道的第一子集和用于所述多个声道中的第二声道的第二子集。该方法可以进一步包括确定所述第一声道和所述第二声道之间的第一相关性集合,所述第一相关性集合中的每个相关性对应于所述第一投影空间子集中的一个投影空间和所述第二投影空间子集中的一个投影空间。另外,该方法可以包括至少部分地基于所述第一相关性集合中的第一相关性和来自所述第一子集的对应于所述第一相关性的投影空间来从所述第一声道的音频信号中提取音频对象,所述第一相关性大于第一预定义阈值。也公开了对应的系统和计算机程序产品。

Patent Agency Ranking