-
公开(公告)号:CN109074818B
公开(公告)日:2023-05-05
申请号:CN201780028437.8
申请日:2017-04-05
Applicant: 杜比实验室特许公司
Inventor: 王珺
IPC: G10L21/0272 , G10L21/028 , G10L21/0308
Abstract: 本发明描述一种用于从混合音频信号(102)估计音频源(101)的源参数的方法(600)。所述混合音频信号(102)包括多个帧。所述混合音频信号(102)可表示为频域中的混合音频矩阵且所述音频源(101)可表示为所述频域中的源矩阵。所述方法(600)包括基于混合矩阵(225)更新(601)非混合矩阵(221),所述非混合矩阵(221)经配置以提供从所述混合音频矩阵对所述源矩阵的估计,所述混合矩阵(225)经配置以提供从所述源矩阵对所述混合音频矩阵的估计。此外,所述方法(600)包括基于所述非混合矩阵(221)且基于所述混合音频信号(102)更新(602)所述混合矩阵(225)。另外,所述方法(600)包括迭代(603)所述更新步骤(601、602)直到满足整体收敛准则。
-
公开(公告)号:CN109074811B
公开(公告)日:2023-05-02
申请号:CN201780028007.6
申请日:2017-04-06
Applicant: 杜比实验室特许公司
IPC: G10L19/008 , G10L21/0272
Abstract: 本文献描述一种用于从音频信道(302)提取音频源(301)的方法(100)。所述方法(100)包含基于来自源矩阵的混合矩阵并基于所述音频源(301)的幂矩阵更新(102)维纳滤波器矩阵。此外,所述方法(100)包含基于所述经更新维纳滤波器矩阵并基于所述音频信道(302)的自协方差矩阵来更新(103)所述音频信道(302)及所述音频源(301)的互协方差矩阵及所述音频信道(301)的自协方差矩阵。另外,所述方法(100)包含基于所述音频信道(302)及所述音频源(301)的所述经更新互协方差矩阵及/或基于所述音频源(301)的所述经更新自协方差矩阵来更新(104)所述混合矩阵及所述幂矩阵。
-
公开(公告)号:CN105989851B
公开(公告)日:2021-05-07
申请号:CN201510082792.6
申请日:2015-02-15
Applicant: 杜比实验室特许公司
IPC: G10L21/0272
Abstract: 公开了一种从音频内容中分离音频源的方法。该方法包括基于音频内容中要被分离的音频源的线性组合特性和音频内容中要被分离的两个或更多音频源之间的正交特性,确定音频源的空间参数。该方法还包括基于空间参数,从音频内容中分离音频源。还公开了相应的系统和计算机程序产品。
-
公开(公告)号:CN109074818A
公开(公告)日:2018-12-21
申请号:CN201780028437.8
申请日:2017-04-05
Applicant: 杜比实验室特许公司
Inventor: 王珺
IPC: G10L21/0272 , G10L21/028 , G10L21/0308
Abstract: 本发明描述一种用于从混合音频信号(102)估计音频源(101)的源参数的方法(600)。所述混合音频信号(102)包括多个帧。所述混合音频信号(102)可表示为频域中的混合音频矩阵且所述音频源(101)可表示为所述频域中的源矩阵。所述方法(600)包括基于混合矩阵(225)更新(601)非混合矩阵(221),所述非混合矩阵(221)经配置以提供从所述混合音频矩阵对所述源矩阵的估计,所述混合矩阵(225)经配置以提供从所述源矩阵对所述混合音频矩阵的估计。此外,所述方法(600)包括基于所述非混合矩阵(221)且基于所述混合音频信号(102)更新(602)所述混合矩阵(225)。另外,所述方法(600)包括迭代(603)所述更新步骤(601、602)直到满足整体收敛准则。
-
-
公开(公告)号:CN106663210A
公开(公告)日:2017-05-10
申请号:CN201580035750.5
申请日:2015-06-24
Applicant: 杜比实验室特许公司
CPC classification number: G10L25/54 , G06K9/6259 , G06K9/6261 , G10L25/03
Abstract: 本文公开的示例实施例涉及基于感受的多媒体处理。公开了一种用于处理多媒体数据的方法,所述方法包括:基于多个类而自动地确定关于所述多媒体数据的片段的用户感受,所述多个类与预定义用户感受相关联地被获取;以及至少部分地基于所确定的关于所述片段的所述用户感受,处理所述多媒体数据的所述片段。还公开了相应的系统和计算机程序产品。
-
公开(公告)号:CN105335595A
公开(公告)日:2016-02-17
申请号:CN201410320668.4
申请日:2014-06-30
Applicant: 杜比实验室特许公司
IPC: G06F19/00
CPC classification number: G10L25/54 , G06K9/6259 , G06K9/6261 , G10L25/03
Abstract: 本发明的实施例涉及基于感受的多媒体处理。公开了一种用于处理多媒体数据的方法,所述方法包括:基于多个类而自动地确定关于所述多媒体数据的片段的用户感受,所述多个类与预定义用户感受相关联地被获取;以及至少部分地基于所确定的关于所述片段的所述用户感受,处理所述多媒体数据的所述片段。还公开了相应的系统和计算机程序产品。
-
公开(公告)号:CN104244164A
公开(公告)日:2014-12-24
申请号:CN201310246729.2
申请日:2013-06-18
Applicant: 杜比实验室特许公司
CPC classification number: H04S7/301 , H04R29/002 , H04R29/005 , H04R2430/20 , H04S3/02 , H04S7/308 , H04S2400/03 , H04S2400/15 , H04S2420/01 , H04S2420/11
Abstract: 本申请涉及生成环绕立体声声场。具体地,提出一种用于生成环绕立体声声场的方法、装置和计算机程序产品。该方法包括:接收由多个音频捕获设备捕获的音频信号;估计多个音频捕获设备的拓扑;并且至少部分地基于估计的拓扑从接收的音频信号生成环绕立体声声场。
-
公开(公告)号:CN104240711A
公开(公告)日:2014-12-24
申请号:CN201310246711.2
申请日:2013-06-18
Applicant: 杜比实验室特许公司
IPC: G10L19/008 , G10L21/038
Abstract: 本发明的实施例涉及自适应音频内容生成。具体而言,公开了一种用于生成自适应音频内容的方法,该方法包括:从基于声道的源音频内容中提取至少一个音频对象,以及至少部分地基于该至少一个音频对象生成自适应音频内容。还公开了相应的系统和计算机程序产品。
-
公开(公告)号:CN106663210B
公开(公告)日:2021-08-20
申请号:CN201580035750.5
申请日:2015-06-24
Applicant: 杜比实验室特许公司
Abstract: 本文公开的示例实施例涉及基于感受的多媒体处理。公开了一种用于处理多媒体数据的方法,所述方法包括:基于多个类而自动地确定关于所述多媒体数据的片段的用户感受,所述多个类与预定义用户感受相关联地被获取;以及至少部分地基于所确定的关于所述片段的所述用户感受,处理所述多媒体数据的所述片段。还公开了相应的系统和计算机程序产品。
-
-
-
-
-
-
-
-
-