-
公开(公告)号:CN112105902A
公开(公告)日:2020-12-18
申请号:CN201980030729.4
申请日:2019-04-10
Applicant: 杜比实验室特许公司
Abstract: 提供了用于训练神经网络以及用于通过训练的神经网络来实现音频编码器和解码器的计算机实现的方法。神经网络可以接收输入音频信号,生成编码音频信号并且对编码音频信号进行解码。损失函数生成模块可以接收解码音频信号和真值音频信号,并且可以生成与解码音频信号相对应的损失函数值。生成损失函数值可涉及应用心理声学模型。可以基于损失函数值来训练神经网络。训练可涉及更新神经网络的至少一个权重。
-
公开(公告)号:CN107770717B
公开(公告)日:2019-12-13
申请号:CN201711094047.9
申请日:2014-12-18
Applicant: 杜比实验室特许公司
IPC: H04S3/00 , H04S7/00 , G10L19/008
Abstract: 本公开涉及响应于多通道音频通过使用至少一个反馈延迟网络产生双耳音频。在一些实施例中,提供用于响应多通道音频信号的通道产生双耳信号的虚拟化方法,这些虚拟化方法向各通道应用双耳房间脉冲响应(BRIR),包含通过使用至少一个反馈延迟网络(FDN)以向通道的下混应用公共晚期混响。在一些实施例中,输入信号通道在第一处理路径中被处理,以向各通道应用的用于该通道的单通道BRIR的直接响应和早期反射部分,并且,通道的下混在包含至少一个应用公共晚期混响的FDN的第二处理路径中被处理。典型地,公共晚期混响模仿单通道BRIR中的至少一些的晚期混响部分的共同宏观属性。其它方面是被配置为执行方法的任何实施例的耳机虚拟化器。
-
公开(公告)号:CN105900168B
公开(公告)日:2019-12-06
申请号:CN201480008591.5
申请日:2014-01-22
Applicant: 杜比实验室特许公司
IPC: G10L19/008 , G10L19/02
Abstract: 所接收的音频数据可包括第一组频率系数和第二组频率系数。可至少部分地基于所述第一组频率系数的至少一部分来估计用于所述第二组频率系数的至少一部分的空间参数。所估计的空间参数可应用于所述第二组频率系数以生成经修正的第二组频率系数。所述第一组频率系数可对应于第一频率范围(例如,单独通道频率范围),而所述第二组频率系数可对应于第二频率范围(例如,耦合通道频率范围)。复合耦合通道的组合频率系数可基于两个或更多个通道的频率系数。第一通道的频率系数与组合频率系数之间的互相关系数可被计算。
-
公开(公告)号:CN107258091B
公开(公告)日:2019-11-26
申请号:CN201680009849.2
申请日:2016-02-11
Applicant: 杜比实验室特许公司
Abstract: 本公开涉及用于耳机虚拟化的混响生成。描述了一种生成用于耳机虚拟化的双耳房间脉冲响应(BRIR)的一个或多个分量的方法。在该方法中,生成定向控制的反射,其中定向控制的反射对与声源定位对应的音频输入信号给予期望的感知线索。然后组合至少所生成的反射来获得BRIR的一个或多个分量。还描述了对应的系统和计算机程序产品。
-
公开(公告)号:CN104981867B
公开(公告)日:2018-03-30
申请号:CN201480008592.X
申请日:2014-01-22
Applicant: 杜比实验室特许公司
IPC: G10L19/008
CPC classification number: G10L19/008 , H04S3/008 , H04S5/00 , H04S2400/03 , H04S2420/03 , H04S2420/07
Abstract: 对应于多个音频通道的音频数据的音频特性可被确定。音频特性可包括空间参数数据。用于音频数据的去相关滤波处理可至少部分地基于该音频特性。去相关滤波处理可在至少一对通道的通道特定去相关信号之间导致特定的去相关信号间相干性(“IDC”)。通道特定去相关信号可被接收和/或确定。多个音频通道对之间的通道间相干性(“ICC”)可被控制。控制ICC可包含接收ICC值或者至少部分地基于空间参数值确定ICC值。一组IDC值可至少部分地基于该组ICC值。对应于该组IDC值的一组通道特定去相关信号可通过对经滤波的音频数据进行操作而被合成。
-
公开(公告)号:CN107750042A
公开(公告)日:2018-03-02
申请号:CN201711094042.6
申请日:2014-12-18
Applicant: 杜比实验室特许公司
IPC: H04S3/00
Abstract: 本公开涉及响应于多通道音频通过使用至少一个反馈延迟网络产生双耳音频。在一些实施例中,提供用于响应多通道音频信号的通道产生双耳信号的虚拟化方法,这些虚拟化方法向各通道应用双耳房间脉冲响应(BRIR),包含通过使用至少一个反馈延迟网络(FDN)以向通道的下混应用公共晚期混响。在一些实施例中,输入信号通道在第一处理路径中被处理,以向各通道应用的用于该通道的单通道BRIR的直接响应和早期反射部分,并且,通道的下混在包含至少一个应用公共晚期混响的FDN的第二处理路径中被处理。典型地,公共晚期混响模仿单通道BRIR中的至少一些的晚期混响部分的共同宏观属性。其它方面是被配置为执行方法的任何实施例的耳机虚拟化器。
-
公开(公告)号:CN105874820A8
公开(公告)日:2016-11-02
申请号:CN201480071993.X
申请日:2014-12-18
Applicant: 杜比实验室特许公司
IPC: H04S3/00
Abstract: 在一些实施例中,提供用于响应多通道音频信号的通道产生双耳信号的虚拟化方法,这些虚拟化方法向各通道应用双耳房间脉冲响应(BRIR),包含通过使用至少一个反馈延迟网络(FDN)以向通道的下混应用公共晚期混响。在一些实施例中,输入信号通道在第一处理路径中被处理,以向各通道应用的用于该通道的单通道BRIR的直接响应和早期反射部分,并且,通道的下混在包含至少一个应用公共晚期混响的FDN的第二处理路径中被处理。典型地,公共晚期混响模仿单通道BRIR中的至少一些的晚期混响部分的共同宏观属性。其它方面是被配置为执行方法的任何实施例的耳机虚拟化器。
-
公开(公告)号:CN105900457A
公开(公告)日:2016-08-24
申请号:CN201480071994.4
申请日:2014-12-23
Applicant: 杜比实验室特许公司
IPC: H04S7/00
CPC classification number: H04S7/304 , H04S7/306 , H04S2400/03 , H04S2420/01 , H04S2420/07
Abstract: 用于设计用于在耳机虚拟器中使用的双耳房间脉冲响应(BRIR)的方法和系统、以及用于响应于多声道音频信号的一组声道产生双耳信号(包括通过将BRIR应用于该组的每个声道),由此产生滤波信号,并且组合滤波信号以产生双耳信号的方法和系统,其中,每个BRIR已根据设计方法的实施例被设计。其它方面是被配置为执行本发明方法的任何实施例的音频处理单元。根据一些实施例,BRIR设计被归结为基于仿真模型(其产生候选BRIR)和至少一个目标函数(其评估每个候选BRIR)的数值优化问题,并且包括识别候选BRIR中由通过每个目标函数对于候选BRIR确定的性能度量所指示的最佳的一个。
-
公开(公告)号:CN104995676A
公开(公告)日:2015-10-21
申请号:CN201480008604.9
申请日:2014-01-22
Applicant: 杜比实验室特许公司
IPC: G10L19/008 , G10L19/02 , H04S3/00 , H04S5/00
Abstract: 音频处理方法可包含接收对应于多个音频通道的音频数据。音频数据可包括对应于音频编码或处理系统的滤波器组系数的频域表示。去相关处理可利用与由音频编码或处理系统使用的滤波器组系数相同的滤波器组系数来执行。去相关处理可在不将频域表示的系数转换成另一频域或时域表示的情况下被执行。去相关处理可包含特定通道和/或特定频带的选择性和/或信号自适应去相关。去相关处理可包含将去相关滤波器应用于所接收的音频数据的一部分以产生经滤波的音频数据。去相关处理可包含使用非分层混合器以根据空间参数将所接收的音频数据的直接部分与经滤波的音频数据进行组合。
-
公开(公告)号:CN104981867A
公开(公告)日:2015-10-14
申请号:CN201480008592.X
申请日:2014-01-22
Applicant: 杜比实验室特许公司
IPC: G10L19/008
CPC classification number: G10L19/008 , H04S3/008 , H04S5/00 , H04S2400/03 , H04S2420/03 , H04S2420/07
Abstract: 对应于多个音频通道的音频数据的音频特性可被确定。音频特性可包括空间参数数据。用于音频数据的去相关滤波处理可至少部分地基于该音频特性。去相关滤波处理可在至少一对通道的通道特定去相关信号之间导致特定的去相关信号间相干性(“IDC”)。通道特定去相关信号可被接收和/或确定。多个音频通道对之间的通道间相干性(“ICC”)可被控制。控制ICC可包含接收ICC值或者至少部分地基于空间参数值确定ICC值。一组IDC值可至少部分地基于该组ICC值。对应于该组IDC值的一组通道特定去相关信号可通过对经滤波的音频数据进行操作而被合成。
-
-
-
-
-
-
-
-
-