-
-
公开(公告)号:CN117083673A
公开(公告)日:2023-11-17
申请号:CN202280021330.1
申请日:2022-04-28
Applicant: 杜比实验室特许公司
IPC: G10L21/0216
Abstract: 公开了情境感知音频处理的实施例。在实施例中,一种音频处理方法包括:利用设备的一个或多个传感器接收由设备捕获的音频录音的环境信息;利用设备的至少一个处理器基于音频录音和环境信息来检测音频录音的情境;利用至少一个处理器基于情境来确定模型;利用至少一个处理器基于模型来处理音频录音以产生噪声抑制的经处理的音频录音;利用至少一个处理器基于情境来确定音频处理配置文件;以及利用至少一个处理器基于音频处理配置文件将音频录音与经处理的音频录音进行组合。
-
公开(公告)号:CN116745844A
公开(公告)日:2023-09-12
申请号:CN202280009447.8
申请日:2022-01-12
IPC: G10L25/87
Abstract: 本文公开了用于将语音的双耳录音分段成包含自身语音的部分和包含外部语音的部分,并使用不同设置处理每个种类以获得增强的整体呈现的方法、系统和计算机程序产品。基于以下组合进行分段:i)基于特征的逐帧分类,和ii)通过统计方法检测相异度。分段信息随后被语音增强链使用,其中独立设置用于处理自身语音部分和外部语音部分。
-
公开(公告)号:CN118266022A
公开(公告)日:2024-06-28
申请号:CN202280076263.3
申请日:2022-10-26
Applicant: 杜比实验室特许公司
IPC: G10L21/028 , G10L25/30 , G10L25/84 , G10L21/0208
Abstract: 本公开涉及一种用于执行源分离的方法和音频处理系统(1)。方法包括:获得(S1)包括语音内容和噪声内容的混合的音频信号(Sin);从音频信号中确定(S2a,S2b,S2c)语音内容(式A)、平稳噪声内容(式C)和非语音内容(式B)。平稳噪声内容(式C)是非语音内容(式B)的真子集,并且方法进一步包括:基于平稳噪声内容(式C)与非语音内容(式B)之间的差异来确定(S3)非平稳噪声内容(式D);获得(S5)加权因子集合;以及基于用相应的加权因子加权的语音内容(式A)、平稳噪声内容(式C)和非平稳噪声内容(式D)的组合来形成(S6)经处理的音频信号。#imgabs0##imgabs1##imgabs2##imgabs3#
-
公开(公告)号:CN116964665A
公开(公告)日:2023-10-27
申请号:CN202280020432.1
申请日:2022-03-09
Applicant: 杜比实验室特许公司
IPC: G10L21/0208
Abstract: 用于混响抑制的方法可以包括接收输入音频信号。该方法可以包括针对输入音频信号的至少一帧计算输入音频信号的初始混响抑制增益。该方法可以包括计算至少一个调整后的混响抑制增益,其中该至少一个调整后的混响抑制增益调整以下中的至少一项:1)基于在输入音频信号中检测到的混响强度的混响抑制衰减;2)基于在输入音频信号中检测到的房间共振量的应用于输入音频信号的不同频带的增益;或者3)基于输入音频信号的直达部分的输入音频信号的响度。该方法可以包括通过将至少一个调整后的混响抑制增益应用于输入音频信号来生成输出音频信号。
-
公开(公告)号:CN119678508A
公开(公告)日:2025-03-21
申请号:CN202380058435.9
申请日:2023-08-07
Applicant: 杜比实验室特许公司
IPC: H04S7/00
Abstract: 提供了用于增强音频内容的方法、系统和介质。在一些实施例中,一种用于增强音频内容的方法涉及从第一音频捕获设备接收多声道音频信号,并从第二音频捕获设备接收双耳音频信号。所述方法还可以涉及从多声道音频信号中提取一个或多个对象。所述方法还可以涉及基于与一个或多个对象相关联的空间信息来生成空间增强掩码。所述方法还可以涉及将空间增强掩码应用于双耳音频信号,以增强双耳音频信号的空间特性,从而生成增强的双耳音频信号。所述方法还可以涉及基于增强的双耳音频信号生成输出双耳音频信号。
-
公开(公告)号:CN118369669A
公开(公告)日:2024-07-19
申请号:CN202280081203.0
申请日:2022-12-08
Applicant: 杜比实验室特许公司
IPC: G06N3/082 , G06N3/09 , G06N3/045 , G06N3/0464 , G06N3/096
Abstract: 本公开涉及一种用于设计处理器(20)的方法和一种计算机实施的神经网络。该方法包括获得输入数据和对应的基准真相目标数据并且将输入数据提供给处理器(20),以在给定输入数据的情况下输出对目标数据的第一预测。该方法进一步包括:将由处理器模块(21:1,21:2,……,21:n‑1)输出的潜在变量提供给监督器模块(22:1,22:2,22:3,……,22:n‑1),该监督器模块基于潜在变量来输出对目标数据的第二预测;以及通过将这些对目标数据的预测与基准真相目标数据进行比较来确定第一损失度量和第二损失度量。该方法进一步包括基于第一损失度量和第二损失度量来训练处理器(20)和监督器模块(22:1,22:2,22:3,……,22:n‑1),并且通过移除、替换和添加处理器模块中的至少一项操作来调整处理器。
-
公开(公告)号:CN116349252A
公开(公告)日:2023-06-27
申请号:CN202180068152.3
申请日:2021-09-15
IPC: H04S1/00
Abstract: 本发明涉及一种用于处理表示由双耳录音设备获取的输入双耳音频信号的第一音频信号和第二音频信号的方法和设备。本发明还涉及一种用于在扬声器系统上渲染双耳音频信号的方法。用于处理双耳信号的方法包括:从第一音频信号提取音频信息;计算用于降低第一音频信号中的噪声的频带增益;以及根据动态缩放因子对第一音频信号的相应频带应用频带增益,以提供第一输出音频信号。其中,该动态缩放因子的值在零到一之间,并且被选择为减少该第一音频信号的质量降级。
-
公开(公告)号:CN112640301A
公开(公告)日:2021-04-09
申请号:CN201980057612.5
申请日:2019-09-26
Applicant: 杜比实验室特许公司
Inventor: 马远星
Abstract: 本申请案涉及响应于输入音频信号而动态地调整压缩器的阈值的方法、系统及计算机程序产品。场景切换分析器接收具有多个频带分量的输入音频信号。所述场景切换分析器确定所述输入音频信号中是否已发生场景切换。处理所述输入音频信号的所述频带分量。响应于确定尚未发生场景切换,失真可听度系统将缓慢平滑应用到所述频带分量的压缩器阈值。响应于确定已发生场景切换,所述失真可听度系统将快速平滑应用到所述频带分量的所述压缩器阈值或不将平滑应用到所述频带分量的所述压缩器阈值。
-
公开(公告)号:CN119256356A
公开(公告)日:2025-01-03
申请号:CN202380041476.7
申请日:2023-04-03
Applicant: 杜比实验室特许公司
IPC: G10L21/02
Abstract: 描述了处理与用户生成内容相关的音频数据的方法。一种方法包括:获得所述音频数据;对所述音频数据应用逐帧音频增强;基于所述逐帧音频增强的一个或多个处理参数来生成所述增强的音频数据的元数据;以及将所述增强的音频数据与所述元数据一起输出。另一种方法包括:获得所述音频数据以及所述音频数据的元数据,其中,所述元数据包括第一元数据,所述第一元数据指示所述音频数据的先前的逐帧音频增强的一个或多个处理参数;使用所述一个或多个处理参数对所述音频数据应用恢复处理,以至少部分地逆转先前的逐帧音频增强;以及对所恢复的原始音频数据应用逐帧音频增强或编辑处理。进一步描述了对应的装置、程序和计算机可读存储介质。
-
-
-
-
-
-
-
-
-