-
公开(公告)号:CN105099795A
公开(公告)日:2015-11-25
申请号:CN201410151665.2
申请日:2014-04-15
Applicant: 杜比实验室特许公司
CPC classification number: H04L47/283 , H04J3/0632 , H04L43/087 , H04L47/30
Abstract: 一些实现涉及根据至少部分地基于累积分布函数(CDF)的抖动缓冲器大小估计算法控制电话会议期间的抖动缓冲器大小。CDF可以至少部分地基于网络抖动参数。可以根据参数化模型初始化CDF。参数化模型的至少一个参数可以至少部分地基于遗留网络抖动信息。
-
公开(公告)号:CN119768865A
公开(公告)日:2025-04-04
申请号:CN202380061659.5
申请日:2023-08-17
Applicant: 杜比实验室特许公司
IPC: G10L21/0208
Abstract: 本文描述了一种对移动设备的音频数据进行环境感知处理的方法。特别地,所述方法可以包括获得移动设备的非声学传感器信息。所述方法可以进一步包括基于非声学传感器信息来确定指示移动设备的环境的场景信息。所述方法还可以进一步包括基于所确定的场景信息来对音频数据进行音频处理。
-
公开(公告)号:CN118077004A
公开(公告)日:2024-05-24
申请号:CN202280065631.4
申请日:2022-08-11
Applicant: 杜比实验室特许公司
Abstract: 公开了一种用于管理用户生成内容(UGC)和专业生成内容(PGC)的系统。该系统被编程为接收来自社交媒体平台的具有两个通道的数字音频数据。该系统被编程为从数字音频数据提取空间特征,该空间特征捕获该两个通道中的差异。该系统还被编程为从数字音频数据中提取时间特征、频谱特征和背景特征。然后,系统被编程为使用所提取的特征来确定在播放之前是将数字音频数据作为UGC还是PGC处理。
-
公开(公告)号:CN117693791A
公开(公告)日:2024-03-12
申请号:CN202280050059.4
申请日:2022-07-12
Applicant: 杜比实验室特许公司
IPC: G10L21/0208 , G06N3/0464 , G10L21/0232
Abstract: 提供了一种用于增强音频信号的方法。在一些实施方式中,所述方法涉及(a)获得包括多个训练样本的训练集,每个训练样本包括失真音频信号和纯净音频信号。在一些实施方式中,所述方法涉及(b)对于所述多个训练样本中的训练样本:获得所述失真音频信号的频域表示;将所述频域表示提供给包括多个卷积层的卷积神经网络(CNN)和循环元件,其中,所述循环元件的输出被提供给所述多个卷积层的子集,生成预测增强掩码,其中,所述CNN生成所述预测增强掩码;基于所述预测增强掩码来生成预测的增强音频信号;以及基于所述预测的增强音频信号来更新与所述CNN和所述循环元件相关联的权重。
-
公开(公告)号:CN116964666A
公开(公告)日:2023-10-27
申请号:CN202280019905.6
申请日:2022-03-10
Applicant: 杜比实验室特许公司
IPC: G10L21/0208
Abstract: 用于抑制混响的方法可以涉及接收输入音频信号。该方法可以涉及将输入音频信号的媒体类型分类为至少包括以下各项的组中的一项:1)言语;2)音乐;或者3)音乐下的言语。该方法可以涉及至少基于确定输入音频信号的媒体类型已被分类为言语来确定是否要对输入音频信号执行去混响。该方法可以涉及响应于确定要对输入音频信号执行去混响,通过对输入音频信号执行去混响来生成输出音频信号。
-
公开(公告)号:CN114127848A
公开(公告)日:2022-03-01
申请号:CN202080051216.4
申请日:2020-07-16
Applicant: 杜比实验室特许公司
IPC: G10L25/60 , G10L25/18 , G10L25/30 , G10L21/0232 , G10L25/78
Abstract: 本文公开了一种用于调整齿音检测器的参数的方法。从正在接收的音频信号中提取时频特征。基于这些时频特征,确定音频信号是否包括短期特征或长期特征。根据确定音频信号包括短期特征或长期特征,对用于检测音频信号中的齿音的齿音检测器的一个或多个参数进行调整。使用具有一个或多个经调整的参数的齿音检测器来检测音频信号中的齿音。
-
公开(公告)号:CN107005678A
公开(公告)日:2017-08-01
申请号:CN201580064780.9
申请日:2015-11-17
Applicant: 杜比实验室特许公司
CPC classification number: H04N7/147 , H04L12/1827 , H04N7/15 , H04S2400/15
Abstract: 本文公开的实施例涉及空间一致性调节。公开了一种用于调节视频会议中的空间一致性的方法。该方法包括:检测由视频端点设备采集的视觉场景与由音频端点设备采集的听觉场景之间的空间一致性,该音频端点设备相对于视频端点设备被定位,空间一致性为听觉场景与视觉场景之间校准的程度、将所检测的空间一致性与预定义的阈值相比较并且响应于所检测的空间一致性低于该阈值而调节空间一致性。还公开了相应的系统和计算机程序产品。
-
公开(公告)号:CN116686280A
公开(公告)日:2023-09-01
申请号:CN202180086965.5
申请日:2021-12-22
Applicant: 杜比实验室特许公司
IPC: H04M3/56
Abstract: 公开了一种用于管理通信系统中的实时音频通信中的声学反馈的方法,该方法包括借助于检测模块确定第一通信设备是否处于扩音器模式、该第一通信设备是否与第二通信设备处于实时音频通信、以及该第一通信设备和该第二通信设备是否处于同一声学空间中。在确定是这种情况时,向缓解模块提供用于请求针对声学反馈采取的一个或多个措施的请求信号。进一步公开了一种被配置成执行该方法的设备和系统、一种非暂态计算机可读介质、一种编码器和一种解码器。
-
-
公开(公告)号:CN111149370A
公开(公告)日:2020-05-12
申请号:CN201880062458.6
申请日:2018-09-27
Applicant: 杜比实验室特许公司
Abstract: 所公开的远程会议方法涉及在远程会议期间检测啸叫状态,所述远程会议涉及两个或更多个远程会议客户端位置以及远程会议服务器。所述远程会议服务器被配置用于在所述远程会议客户端位置之间提供全双工音频连接。所述啸叫状态是涉及某一远程会议客户端位置中的两个或更多个远程会议装置的声反馈状态。检测所述啸叫状态涉及对远程会议音频数据的频谱特性和时间特性两者的分析。所公开的远程会议方法涉及确定哪个客户端位置正在导致所述啸叫状态并且涉及减轻所述啸叫状态或者发送啸叫状态检测消息。
-
-
-
-
-
-
-
-
-