-
公开(公告)号:CN109644304A
公开(公告)日:2019-04-16
申请号:CN201780052977.X
申请日:2017-08-28
Applicant: 杜比实验室特许公司
Inventor: 王珺
CPC classification number: H04S3/008 , G10L21/028 , G10L25/18 , G10L25/21 , H03H2021/0034 , H04R1/406 , H04R3/005 , H04S2400/15
Abstract: 本发明揭示混响环境的源分离的实施例。根据方法,分别通过至少两个麦克风针对其间仅至少一个源中的个别者产生声音的时段捕获针对每一所述个别者的第一麦克风信号。通过处理器基于所述第一麦克风信号学习用于对所述至少一个源与所述至少两个麦克风之间的声路建模的混合参数。分别通过所述至少两个麦克风针对其间所述至少一个源中的全部产生声音的时段捕获第二麦克风信号。通过所述处理器基于所述混合参数及第二麦克风信号估计所述重建模型。所述处理器通过应用所述重建模型而执行所述源分离。
-
公开(公告)号:CN104080024B
公开(公告)日:2019-02-19
申请号:CN201310100422.1
申请日:2013-03-26
Applicant: 杜比实验室特许公司
Abstract: 公开了音量校平器控制器和控制方法、音频分类器和分类方法以及音频处理设备。在一个实施方式中,音量校平器控制方法包括:实时地识别音频信号的内容类型;以及通过随着音频信号的信息性内容类型的置信度值的增大或减小而分别增大或减小音量校平器的动态增益,并且随着音频信号的干扰性内容类型的置信度值的减小或增大而分别增大或减小音量校平器的动态增益,来基于所识别的内容类型以连续的方式调整音量校平器;其中,将音频信号分类到具有相应置信度值的多个内容类型中,并且调整的操作被配置成通过基于多个内容类型的重要性对多个内容类型的置信度值进行加权来考虑多个内容类型中的至少一些内容类型。
-
公开(公告)号:CN107251138A
公开(公告)日:2017-10-13
申请号:CN201680010459.7
申请日:2016-02-11
Applicant: 杜比实验室特许公司
Inventor: 王珺
IPC: G10L21/028 , G10L21/0216 , G10L21/0232
Abstract: 本文公开的示例实施例涉及音频内容中的源分离。公开了一种用于从音频内容分离源的方法,该音频内容是基于多个声道的多声道格式。该方法包括对音频内容针对多个声道的每个声道执行成分分析以生成多个成分,多个成分中的每个成分包括在全频带中的多个时频块,利用多个成分中的至少一个时频块生成至少一个支配源,并且通过基于支配源估计空间参数和频谱参数将源从音频内容分离。还公开了相应的系统和计算机程序产品。
-
公开(公告)号:CN105340299B
公开(公告)日:2017-09-12
申请号:CN201480034420.X
申请日:2014-06-17
Applicant: 杜比实验室特许公司
CPC classification number: H04S7/301 , H04R29/002 , H04R29/005 , H04R2430/20 , H04S3/02 , H04S7/308 , H04S2400/03 , H04S2400/15 , H04S2420/01 , H04S2420/11
Abstract: 本申请涉及生成环绕立体声声场。具体地,提出一种用于生成环绕立体声声场的方法、装置和计算机程序产品。该方法包括:接收由多个音频捕获设备捕获的音频信号;估计多个音频捕获设备的拓扑;并且至少部分地基于估计的拓扑从接收的音频信号生成环绕立体声声场。
-
公开(公告)号:CN105989852A
公开(公告)日:2016-10-05
申请号:CN201510085195.9
申请日:2015-02-16
Applicant: 杜比实验室特许公司
Inventor: 王珺
IPC: G10L21/0272 , G10L21/0308
CPC classification number: G10L21/028 , G06F3/0484 , G06F3/16 , G06F3/165 , G06F3/167 , G10H2210/305 , G10L19/008 , G10L21/0232 , G10L2021/02166
Abstract: 本文公开的示例实施例涉及音频内容中的源分离。公开了一种用于从音频内容分离源的方法,该音频内容是基于多个声道的多声道格式。该方法包括对音频内容在多个声道的每个声道上执行成分分析以生成多个成分,多个成分中的每个成分包括在全频带上的多个时频块,利用多个成分中的至少一个时频块生成至少一个支配源,并且基于支配源通过估计空间参数和频谱参数将源从音频内容分离。还公开了相应的系统和计算机程序产品。
-
公开(公告)号:CN105874533A
公开(公告)日:2016-08-17
申请号:CN201480064848.9
申请日:2014-11-25
Applicant: 杜比实验室特许公司
IPC: G10L19/008
Abstract: 本发明的实施例涉及音频对象提取。公开了一种用于从音频内容中提取音频对象的方法,所述音频内容具有基于多个声道的格式,所述方法包括:至少部分地基于所述多个声道之间的频谱相似性,对所述音频内容的各帧应用音频对象提取;以及基于对所述各帧的所述音频对象提取,跨所述音频内容的帧执行音频对象合成,以生成至少一个音频对象的音轨。还公开了相应的系统和计算机程序产品。
-
公开(公告)号:CN105074822A
公开(公告)日:2015-11-18
申请号:CN201480018590.9
申请日:2014-03-25
Applicant: 杜比实验室特许公司
Abstract: 公开了用于音频分类和处理的装置和方法。在一个实施例中,音频处理装置包括:音频分类器,用于实时地将音频信号分类为至少一种音频类型;音频改进设备,用于改进听众的体验;以及调整单元,用于基于所述至少一种音频类型的置信度值以连续的方式调整音频改进设备的至少一个参数。
-
公开(公告)号:CN104217729A
公开(公告)日:2014-12-17
申请号:CN201310214901.6
申请日:2013-05-31
Applicant: 杜比实验室特许公司
IPC: G10L21/0272 , G10L25/90
CPC classification number: G10H1/40 , G10H2210/041 , G10H2210/051 , G10H2210/076 , G10H2240/075 , G10H2250/015
Abstract: 本申请描述了音频处理方法和音频处理装置以及训练方法。根据本申请的实施方式,重音识别器用于从多个音频帧中识别重音帧,产生包括针对多个音频帧的重音和/或非重音判定的概率得分的重音序列。然后速度估计器用于基于重音序列来估计多个音频帧的速度序列。所述实施方式可以很好地适应于速度的变化,并且可以进一步用于正确地跟踪拍子。
-
公开(公告)号:CN104079247B
公开(公告)日:2018-02-09
申请号:CN201310100401.X
申请日:2013-03-26
Applicant: 杜比实验室特许公司
Abstract: 公开了均衡器控制器和控制方法以及音频再现设备。在一个实施方式中,均衡器控制器包括:音频分类器,用于实时地识别音频信号的音频类型;以及调整单元,用于基于所识别的音频类型的置信度值来以连续的方式调整均衡器,其中,音频分类器被配置成将音频信号分类到具有相应置信度值的多个音频类型中,并且调整单元被配置成通过基于多个音频类型的重要性对多个音频类型的置信度值进行加权来考虑多个音频类型中的至少一些音频类型。
-
公开(公告)号:CN105336332A
公开(公告)日:2016-02-17
申请号:CN201410357288.8
申请日:2014-07-17
Applicant: 杜比实验室特许公司
IPC: G10L19/008
CPC classification number: G10L19/0204 , G10L19/008 , G10L21/0308 , G10L25/21 , H04S3/008
Abstract: 本发明的实施例涉及信号处理。公开了分解来自至少两个不同声道的多个音频信号的方法。该方法包括获得一组成分,该组成分是弱相关的,该组成分基于该多个音频信号而生成。该方法包括从该组成分提取特征,并且至少部分地基于所提取的特征来确定与该组成分相关联的一组增益,该增益中的每个增益指示相关联的成分中的扩散部分的比例。该方法还包括通过将该组增益应用到该组成分来分解该多个音频信号。还公开了相应的系统和计算机程序产品。
-
-
-
-
-
-
-
-
-