-
公开(公告)号:CN119998877A
公开(公告)日:2025-05-13
申请号:CN202380070590.2
申请日:2023-07-28
Applicant: 杜比实验室特许公司
IPC: G10L21/0208
Abstract: 对系统进行编程以建立机器学习模型,该机器学习模型包括一系列掩码块。每个掩码块接收音频片段的某个特征向量。每个掩码块包括第一部件和第二部件,第一部件生成用于提取干净语音的第一掩码,第二部件生成用于提取被第一掩码掩盖的残余语音的第二掩码。每个掩码块还基于第一掩码和第二掩码生成特定的特征向量,该特定的特征向量会成为下一个掩码块的某个特征向量。第二部件可以包括门控循环单元层,相较于可以包括多个卷积层的第一部件,该第二部件的计算复杂度较低。此外,该系统被编程为接收输入音频片段的输入特征向量,并且执行机器学习模型以获得输出音频片段的输出特征向量。
-
公开(公告)号:CN118202408A
公开(公告)日:2024-06-14
申请号:CN202280073306.2
申请日:2022-11-03
Applicant: 杜比实验室特许公司
IPC: G10L21/0208 , G10L21/0272 , G10L21/034 , H03G3/20 , G10L21/0364
Abstract: 本文描述了一种对包含不同类型的多个音频分量的音频信号执行内容感知音频处理的方法。该方法包括将音频信号源分离为至少语音相关音频分量以及残余音频分量。该方法还包括基于语音相关音频分量和残余音频分量来确定动态音频增益。该方法还包括基于确定的音频增益对音频信号执行音频电平调整。进一步描述了相应的装置、程序和计算机可读存储介质。
-
公开(公告)号:CN117917094A
公开(公告)日:2024-04-19
申请号:CN202280061137.0
申请日:2022-09-07
Applicant: 杜比实验室特许公司
IPC: H04R3/00 , H04R29/00 , G06F3/16 , G10L25/60 , H04M1/72403
Abstract: 公开了一种用于实时监控用户生成的音频内容以发现音频异常的系统和相关方法。在一些实施例中,所述系统被编程为实时地接收由第一移动设备(比如智能手机)生成的音频数据。所述系统被编程为根据音频数据实时地确定是否发生音频异常。所述系统被编程为响应于检测到音频异常的发生而实时地向第二移动设备(其可以是同一部智能手机)呈现警报。
-
公开(公告)号:CN113766073B
公开(公告)日:2024-04-16
申请号:CN202111051519.9
申请日:2018-09-27
Applicant: 杜比实验室特许公司
Abstract: 本公开涉及会议系统中的啸叫检测。所公开的远程会议方法涉及在远程会议期间检测啸叫状态,所述远程会议涉及两个或更多个远程会议客户端位置以及远程会议服务器。所述远程会议服务器被配置用于在所述远程会议客户端位置之间提供全双工音频连接。所述啸叫状态是涉及某一远程会议客户端位置中的两个或更多个远程会议装置的声反馈状态。检测所述啸叫状态涉及对远程会议音频数据的频谱特性和时间特性两者的分析。所公开的远程会议方法涉及确定哪个客户端位置正在导致所述啸叫状态并且涉及减轻所述啸叫状态或者发送啸叫状态检测消息。
-
公开(公告)号:CN109643553B
公开(公告)日:2023-09-05
申请号:CN201780034264.0
申请日:2017-06-07
Applicant: 杜比实验室特许公司
IPC: G10L21/0232 , G10L21/0208
Abstract: 本发明涉及用以下至少一者对输入音频信号进行回波估计或回波管理(回波抑制或消除)的方法:调适稀疏预测滤波器集、修改(例如,截断)经调适预测滤波器脉冲响应、从经调适预测滤波器脉冲响应生成复合脉冲响应、或以至少部分通过将所述输入音频信号分类为无回波(或非回波)确定的方式使用回波估计及/或回波管理资源。其它方面是经配置以执行所述方法中的任何者的任何实施例的系统。
-
公开(公告)号:CN114303392A
公开(公告)日:2022-04-08
申请号:CN202080060506.5
申请日:2020-08-27
Applicant: 杜比实验室特许公司
IPC: H04R3/12 , G10L19/008 , H04S3/00 , H04S7/00
Abstract: 提供了一种用于对包括X>1个声道的多声道音频信号进行声道标识的方法。所述方法包括以下步骤:在所述X个声道中标识任何空声道,从而产生具有Y≤X个非空声道的子集;确定在所述Y个声道中是否存在低频效果(LFE)声道,并且在确定存在LFE声道时,将所述Y个声道中的所确定的声道标识为所述LFE声道;通过匹配对称声道来将所述Y个声道中未被标识为所述LFE声道的剩余声道划分为任何数量的声道对;以及将所述Y个声道中未被标识为所述LFE声道或被划分为对的任何剩余未配对声道标识为中央声道。
-
公开(公告)号:CN113766073A
公开(公告)日:2021-12-07
申请号:CN202111051519.9
申请日:2018-09-27
Applicant: 杜比实验室特许公司
Abstract: 本公开涉及会议系统中的啸叫检测。所公开的远程会议方法涉及在远程会议期间检测啸叫状态,所述远程会议涉及两个或更多个远程会议客户端位置以及远程会议服务器。所述远程会议服务器被配置用于在所述远程会议客户端位置之间提供全双工音频连接。所述啸叫状态是涉及某一远程会议客户端位置中的两个或更多个远程会议装置的声反馈状态。检测所述啸叫状态涉及对远程会议音频数据的频谱特性和时间特性两者的分析。所公开的远程会议方法涉及确定哪个客户端位置正在导致所述啸叫状态并且涉及减轻所述啸叫状态或者发送啸叫状态检测消息。
-
公开(公告)号:CN109643553A
公开(公告)日:2019-04-16
申请号:CN201780034264.0
申请日:2017-06-07
Applicant: 杜比实验室特许公司
IPC: G10L21/0232 , G10L21/0208
Abstract: 本发明涉及用以下至少一者对输入音频信号进行回波估计或回波管理(回波抑制或消除)的方法:调适稀疏预测滤波器集、修改(例如,截断)经调适预测滤波器脉冲响应、从经调适预测滤波器脉冲响应生成复合脉冲响应、或以至少部分通过将所述输入音频信号分类为无回波(或非回波)确定的方式使用回波估计及/或回波管理资源。其它方面是经配置以执行所述方法中的任何者的任何实施例的系统。
-
-
公开(公告)号:CN105898185A
公开(公告)日:2016-08-24
申请号:CN201410670335.4
申请日:2014-11-19
Applicant: 杜比实验室特许公司
CPC classification number: H04N7/147 , H04L12/1827 , H04N7/15 , H04S2400/15
Abstract: 本发明的实施例涉及空间一致性调节。公开了一种用于调节视频会议中的空间一致性的方法。该方法包括:检测由视频端点设备采集的视觉场景与由音频端点设备采集的听觉场景之间的空间一致性,该音频端点设备相对于视频端点设备被定位,空间一致性为听觉场景与视觉场景之间校准的程度;将所检测的空间一致性与预定的阈值相比较;并且响应于所检测的空间一致性低于该阈值而调节空间一致性。还公开了相应的系统和计算机程序产品。
-
-
-
-
-
-
-
-
-