-
公开(公告)号:CN118922884A
公开(公告)日:2024-11-08
申请号:CN202380026675.0
申请日:2023-03-08
Applicant: 杜比实验室特许公司
IPC: G10L21/0208 , G10L21/0232 , G10L21/0216
Abstract: 本公开涉及一种用于抑制风噪声的方法和系统(1)。该方法包括获取包括多个连续音频信号分段(101、102、103、101'、102'、103')的输入音频信号(100、101'),并且用风噪声抑制器模块(20)抑制输入音频信号中的风噪声以产生风噪声降低的音频信号。该方法还包括使用经训练以预测增益集的神经网络(10),用于降低输入音频信号(100、100')的输入音频信号(100、100')给定样本中的噪声,其中通过将所述增益集施加给输入音频信号(100、101')来形成降噪音频信号,并用混频器(30)混合风噪声降低的音频信号和降噪音频信号,以获取具有经抑制风噪声的输出音频信号。
-
公开(公告)号:CN116964666A
公开(公告)日:2023-10-27
申请号:CN202280019905.6
申请日:2022-03-10
Applicant: 杜比实验室特许公司
IPC: G10L21/0208
Abstract: 用于抑制混响的方法可以涉及接收输入音频信号。该方法可以涉及将输入音频信号的媒体类型分类为至少包括以下各项的组中的一项:1)言语;2)音乐;或者3)音乐下的言语。该方法可以涉及至少基于确定输入音频信号的媒体类型已被分类为言语来确定是否要对输入音频信号执行去混响。该方法可以涉及响应于确定要对输入音频信号执行去混响,通过对输入音频信号执行去混响来生成输出音频信号。
-
公开(公告)号:CN114127848A
公开(公告)日:2022-03-01
申请号:CN202080051216.4
申请日:2020-07-16
Applicant: 杜比实验室特许公司
IPC: G10L25/60 , G10L25/18 , G10L25/30 , G10L21/0232 , G10L25/78
Abstract: 本文公开了一种用于调整齿音检测器的参数的方法。从正在接收的音频信号中提取时频特征。基于这些时频特征,确定音频信号是否包括短期特征或长期特征。根据确定音频信号包括短期特征或长期特征,对用于检测音频信号中的齿音的齿音检测器的一个或多个参数进行调整。使用具有一个或多个经调整的参数的齿音检测器来检测音频信号中的齿音。
-
公开(公告)号:CN119790458A
公开(公告)日:2025-04-08
申请号:CN202380060928.6
申请日:2023-08-18
Applicant: 杜比实验室特许公司
IPC: G10L21/028 , G10L19/008 , G06N3/045 , G06N3/08
Abstract: 公开了一种用于分离混合音频信号中的音频对象的方法,所述混合音频信号包括多个音频对象。进一步公开了一种用于训练稀疏音频对象分离模型的计算机实施的方法以及一种用于从混合音频信号中分离稀疏音频对象的方法,所述混合音频信号至少包括稀疏音频对象、非稀疏音频对象以及至少一个另外的音频对象。进一步公开了一种用于基于信噪比SNR来处理音频的计算机实施的方法以及一种用于基于场景环境分类来处理音频的计算机实施的方法。公开了一种非暂态计算机可读介质以及一种被配置为执行所述方法中的一种或多种的系统。
-
公开(公告)号:CN119422389A
公开(公告)日:2025-02-11
申请号:CN202380049436.7
申请日:2023-06-23
Applicant: 杜比实验室特许公司
IPC: H04S5/00
Abstract: 本公开涉及一种用于处理音频的方法和系统,以及一种包括指令的计算机程序产品,当所述程序由计算机执行时,所述指令使所述计算机执行所述方法。所述方法包括获得输入音频信号并处理所述输入音频信号以从所述输入音频信号中提取高度音频对象,其中,所述高度音频对象是使用被配置为提取预定高度音频源类型的音频对象的源分离模块来提取的。所述方法进一步包括将所述输入音频信号渲染到多声道呈现,使得所述至少一个高度音频对象被包括在所述多声道呈现的至少一个高度声道中。
-
-
公开(公告)号:CN117917094A
公开(公告)日:2024-04-19
申请号:CN202280061137.0
申请日:2022-09-07
Applicant: 杜比实验室特许公司
IPC: H04R3/00 , H04R29/00 , G06F3/16 , G10L25/60 , H04M1/72403
Abstract: 公开了一种用于实时监控用户生成的音频内容以发现音频异常的系统和相关方法。在一些实施例中,所述系统被编程为实时地接收由第一移动设备(比如智能手机)生成的音频数据。所述系统被编程为根据音频数据实时地确定是否发生音频异常。所述系统被编程为响应于检测到音频异常的发生而实时地向第二移动设备(其可以是同一部智能手机)呈现警报。
-
公开(公告)号:CN117044233A
公开(公告)日:2023-11-10
申请号:CN202280021289.8
申请日:2022-04-28
Applicant: 杜比实验室特许公司
IPC: H04R3/00
Abstract: 公开了情境感知声景控制的实施例。在实施例中,一种音频处理方法包括:使用移动设备上的第一组麦克风捕获来自音频场景的第一音频信号;使用一副耳塞上的第二组麦克风捕获来自所述音频场景的第二音频信号;使用所述移动设备上的相机捕获来自视频场景的视频信号;利用至少一个处理器从所述第一音频信号和所述第二音频信号生成经处理的音频信号,所述经处理的音频信号是基于情境信息通过自适应声景控制来生成的;以及利用所述至少一个处理器将所述经处理的音频信号与所捕获的视频信号进行组合以作为多媒体输出。
-
-
公开(公告)号:CN112640301B
公开(公告)日:2022-03-29
申请号:CN201980057612.5
申请日:2019-09-26
Applicant: 杜比实验室特许公司
Inventor: 马远星
Abstract: 本申请案涉及响应于输入音频信号而动态地调整压缩器的阈值的方法、系统及计算机程序产品。场景切换分析器接收具有多个频带分量的输入音频信号。所述场景切换分析器确定所述输入音频信号中是否已发生场景切换。处理所述输入音频信号的所述频带分量。响应于确定尚未发生场景切换,失真可听度系统将缓慢平滑应用到所述频带分量的压缩器阈值。响应于确定已发生场景切换,所述失真可听度系统将快速平滑应用到所述频带分量的所述压缩器阈值或不将平滑应用到所述频带分量的所述压缩器阈值。
-
-
-
-
-
-
-
-
-