-
公开(公告)号:CN103325385B
公开(公告)日:2018-01-26
申请号:CN201210080132.0
申请日:2012-03-23
Applicant: 杜比实验室特许公司
IPC: G10L25/78
CPC classification number: H04L49/90 , G10L19/167 , G10L25/78 , H04L65/1066 , H04M3/569
Abstract: 描述了语音通信方法和设备、操作抖动缓冲器的方法和设备。顺序获得音频块。音频块中的每个音频块包括一个或更多个音频帧。对音频块进行语音活动检测。响应于针对音频块中的当前音频块做出发声起始的判决,取得所获得的音频块的序列的子序列。子序列包括紧临在当前音频块之前的多个音频块。子序列具有预定长度。针对子序列中的每个音频块做出了非语音的判决。将当前音频块和子序列中的音频块发送给接收方。子序列中的音频块被标识为再处理的音频块,以向接收方通知这些音频块与当前音频块不同并且被再处理为包括语音。响应于针对当前音频块做出非语音的判决,缓冲存储当前音频块。
-
公开(公告)号:CN107978325A
公开(公告)日:2018-05-01
申请号:CN201711404270.9
申请日:2012-03-23
Applicant: 杜比实验室特许公司
IPC: G10L25/78
CPC classification number: H04L49/90 , G10L19/167 , G10L25/78 , H04L65/1066 , H04M3/569
Abstract: 描述了语音通信方法和设备、操作抖动缓冲器的方法和设备。方法包括:从发送方接收至少一个音频块,如果接收的音频块被标识为再处理的音频块,则确定接收的音频块是否超时;如果确定超时,则如果确定接收的音频块与从相应抖动缓冲器中移出但是等待混合的条目对应于相同时间,则用接收的音频块更新该条目,并且如果确定没有对应于相同时间,则将接收的音频块发送至目的地;如果确定没有超时,则用接收的音频块更新抖动缓冲器中与接收的音频块对应于相同时间的条目;如果接收的音频块没有被标识为再处理的音频块,则将接收的音频块填入到抖动缓冲器中与接收的音频块对应于相同时间的条目中。
-
公开(公告)号:CN103325386B
公开(公告)日:2016-12-21
申请号:CN201210080977.X
申请日:2012-03-23
Applicant: 杜比实验室特许公司
IPC: G10L25/78
CPC classification number: G10L25/84 , G10L25/78 , G10L2025/783
Abstract: 描述了用于信号传输控制的方法和系统。接收或访问具有块或帧的时间序列的音频信号。特征被确定为合起来表征相对于当前时间最近已经处理的顺序音频块/帧。特征确定超过特异度标准,并且相对于最近处理的音频块/帧被延迟。在音频信号中检测语音活动指示。VAD基于一个判决并且涉及当前块/帧特征,该判决超过预设灵敏度阈值,并且在相对于块/帧时长的短时间段上计算而得。VAD和最近特征确定与状态相关信息进行组合,所述信息基于从多个特征中收集、在最近特征确定时间段之前的时间确定的先前特征确定的历史。基于所述组合输出有关开始或终止所述音频信号的判决,或相关的增益。
-
公开(公告)号:CN103325386A
公开(公告)日:2013-09-25
申请号:CN201210080977.X
申请日:2012-03-23
Applicant: 杜比实验室特许公司
IPC: G10L25/78
CPC classification number: G10L25/84 , G10L25/78 , G10L2025/783
Abstract: 描述了用于信号传输控制的方法和系统。接收或访问具有块或帧的时间序列的音频信号。特征被确定为合起来表征相对于当前时间最近已经处理的顺序音频块/帧。特征确定超过特异度标准,并且相对于最近处理的音频块/帧被延迟。在音频信号中检测语音活动指示。VAD基于一个判决并且涉及当前块/帧特征,该判决超过预设灵敏度阈值,并且在相对于块/帧时长的短时间段上计算而得。VAD和最近特征确定与状态相关信息进行组合,所述信息基于从多个特征中收集、在最近特征确定时间段之前的时间确定的先前特征确定的历史。基于所述组合输出有关开始或终止所述音频信号的判决,或相关的增益。
-
公开(公告)号:CN103325380A
公开(公告)日:2013-09-25
申请号:CN201210080971.2
申请日:2012-03-23
Applicant: 杜比实验室特许公司
IPC: G10L21/0208
CPC classification number: G10L21/0364 , G10K11/16 , G10L21/0224 , G10L21/0316 , G10L21/034 , G10L25/78 , H03G3/301 , H03G3/32
Abstract: 本发明为用于信号增强的增益后处理,涉及一种方法、一种装置以及逻辑,用于对通过输入处理确定的原始增益进行后处理以生成经后处理的增益,包括使用增量增益平滑和判决引导的增益平滑之一或两者。增量增益平滑包括将具有取决于如下增益增量的平滑因子的平滑滤波器应用于原始增益:当前帧的原始增益和前一帧的经后处理的增益之间的差的绝对值。判决引导的增益平滑包括将原始增益转换为信噪比,将具有平滑因子的平滑滤波器应用到信噪比以计算平滑信噪比,以及转换平滑信噪比以确定第二平滑增益,其中平滑因子可能取决于增益增量。
-
公开(公告)号:CN107978325B
公开(公告)日:2022-01-11
申请号:CN201711404270.9
申请日:2012-03-23
Applicant: 杜比实验室特许公司
IPC: G10L25/78
Abstract: 描述了语音通信方法和设备、操作抖动缓冲器的方法和设备。方法包括:从发送方接收至少一个音频块,如果接收的音频块被标识为再处理的音频块,则确定接收的音频块是否超时;如果确定超时,则如果确定接收的音频块与从相应抖动缓冲器中移出但是等待混合的条目对应于相同时间,则用接收的音频块更新该条目,并且如果确定没有对应于相同时间,则将接收的音频块发送至目的地;如果确定没有超时,则用接收的音频块更新抖动缓冲器中与接收的音频块对应于相同时间的条目;如果接收的音频块没有被标识为再处理的音频块,则将接收的音频块填入到抖动缓冲器中与接收的音频块对应于相同时间的条目中。
-
公开(公告)号:CN103325380B
公开(公告)日:2017-09-12
申请号:CN201210080971.2
申请日:2012-03-23
Applicant: 杜比实验室特许公司
IPC: G10L21/0208
CPC classification number: G10L21/0364 , G10K11/16 , G10L21/0224 , G10L21/0316 , G10L21/034 , G10L25/78 , H03G3/301 , H03G3/32
Abstract: 本发明涉及一种方法、一种装置以及逻辑,用于对通过输入处理确定的原始增益进行后处理以生成经后处理的增益,包括使用增量增益平滑和判决引导的增益平滑之一或两者。增量增益平滑包括将具有取决于如下增益增量的平滑因子的平滑滤波器应用于原始增益:当前帧的原始增益和前一帧的经后处理的增益之间的差的绝对值。判决引导的增益平滑包括将原始增益转换为信噪比,将具有平滑因子的平滑滤波器应用到信噪比以计算平滑信噪比,以及转换平滑信噪比以确定第二平滑增益,其中平滑因子可能取决于增益增量。
-
公开(公告)号:CN104019885A
公开(公告)日:2014-09-03
申请号:CN201310064537.X
申请日:2013-02-28
Applicant: 杜比实验室特许公司
IPC: G01H11/06
CPC classification number: H04S7/30 , G01S3/802 , G10L19/008 , H04S2400/15
Abstract: 本发明涉及一种声场分析系统。在一个实施例中,通过提取空间角度信息、发散度信息(并且可选地提取声音等级信息)来映射声场。映射所提取的信息以用于以黎曼球体的形式来展示,其中,沿着球体,空间角度在经度上变化,发散度在维度上变化,并且等级在径向上变化。更一般的映射利用将空间角度和发散度信息映射到代表性区域上,以表现在与所提取的空间信息相对应的到达的方向中的变化以及在与所提取的发散度信息相对应的距离中的变化。
-
公开(公告)号:CN103325385A
公开(公告)日:2013-09-25
申请号:CN201210080132.0
申请日:2012-03-23
Applicant: 杜比实验室特许公司
IPC: G10L25/78
CPC classification number: H04L49/90 , G10L19/167 , G10L25/78 , H04L65/1066 , H04M3/569
Abstract: 描述了语音通信方法和设备、操作抖动缓冲器的方法和设备。顺序获得音频块。音频块中的每个音频块包括一个或更多个音频帧。对音频块进行语音活动检测。响应于针对音频块中的当前音频块做出发声起始的判决,取得所获得的音频块的序列的子序列。子序列紧临在所述当前音频块之前。子序列具有预定长度。针对子序列中的每个音频块做出了非语音的判决。将当前音频块和子序列中的音频块发送给接收方。子序列中的音频块被标识为再处理的音频块。响应于针对当前音频块做出非语音的判决,缓冲存储当前音频块。
-
公开(公告)号:CN103325379A
公开(公告)日:2013-09-25
申请号:CN201210080810.3
申请日:2012-03-23
Applicant: 杜比实验室特许公司
IPC: G10L21/0208
CPC classification number: G10L21/0208 , G10L21/02 , G10L25/12 , G10L2021/02082
Abstract: 描述了用于声学回声控制的方法与装置的实施方式。根据所述方法,进行基于回声能量的双端发声检测,以参考扬声器信号来确定在麦克风信号中是否存在双端发声。计算麦克风信号的频谱与扬声器信号的频谱之间的谱相似度。如果谱相似度高于门限水平,则确定在麦克风信号中不存在双端发声。如果通过基于回声能量的双端发声检测或通过基于谱相似度的双端发声检测确定在麦克风信号中不存在双端发声,则使能自适应滤波器的自适应,自适应滤波器用于对麦克风信号应用声学回声消除或声学回声抑制。
-
-
-
-
-
-
-
-
-