-
公开(公告)号:CN112105902B
公开(公告)日:2022-07-22
申请号:CN201980030729.4
申请日:2019-04-10
Applicant: 杜比实验室特许公司
Abstract: 提供了用于训练神经网络以及用于通过训练的神经网络来实现音频编码器和解码器的计算机实现的方法。神经网络可以接收输入音频信号,生成编码音频信号并且对编码音频信号进行解码。损失函数生成模块可以接收解码音频信号和真值音频信号,并且可以生成与解码音频信号相对应的损失函数值。生成损失函数值可涉及应用心理声学模型。可以基于损失函数值来训练神经网络。训练可涉及更新神经网络的至少一个权重。
-
公开(公告)号:CN108496221A
公开(公告)日:2018-09-04
申请号:CN201780008056.3
申请日:2017-01-26
Applicant: 杜比实验室特许公司
IPC: G10L19/002 , G10L19/00 , H03M1/00
Abstract: 可以对多个接收的音频对象中的每个音频对象确定重要性度量,该重要性度量至少部分地基于能量度量。一些方法可以包含:至少部分地基于通过对音频对象中的每个音频对象的能量度量进行求和而计算的总能量值来对音频对象中的所有音频对象确定总体重要性度量;对音频对象中的每个音频对象确定估计的量化位深和量化误差;对音频对象中的所有音频对象计算总噪声度量,总噪声度量至少部分地基于与估计的量化位深相对应的总量化误差;计算与总噪声度量和总能量值相对应的总信噪比;并且通过将信噪比阈值应用于总信噪比来对音频对象中的每个音频对象确定最终量化位深。
-
公开(公告)号:CN115410583A
公开(公告)日:2022-11-29
申请号:CN202210834906.8
申请日:2019-04-10
Applicant: 杜比实验室特许公司
Abstract: 本公开涉及基于机器学习的用于音频编码和解码的基于感知的损失函数。提供了用于训练神经网络以及用于通过训练的神经网络来实现音频编码器和解码器的计算机实现的方法。神经网络可以接收输入音频信号,生成编码音频信号并且对编码音频信号进行解码。损失函数生成模块可以接收解码音频信号和真值音频信号,并且可以生成与解码音频信号相对应的损失函数值。生成损失函数值可涉及应用心理声学模型。可以基于损失函数值来训练神经网络。训练可涉及更新神经网络的至少一个权重。
-
公开(公告)号:CN112105902A
公开(公告)日:2020-12-18
申请号:CN201980030729.4
申请日:2019-04-10
Applicant: 杜比实验室特许公司
Abstract: 提供了用于训练神经网络以及用于通过训练的神经网络来实现音频编码器和解码器的计算机实现的方法。神经网络可以接收输入音频信号,生成编码音频信号并且对编码音频信号进行解码。损失函数生成模块可以接收解码音频信号和真值音频信号,并且可以生成与解码音频信号相对应的损失函数值。生成损失函数值可涉及应用心理声学模型。可以基于损失函数值来训练神经网络。训练可涉及更新神经网络的至少一个权重。
-
公开(公告)号:CN108496221B
公开(公告)日:2020-01-21
申请号:CN201780008056.3
申请日:2017-01-26
Applicant: 杜比实验室特许公司
IPC: G10L19/002 , G10L19/00 , H03M1/00
Abstract: 可以对多个接收的音频对象中的每个音频对象确定重要性度量,该重要性度量至少部分地基于能量度量。一些方法可以包含:至少部分地基于通过对音频对象中的每个音频对象的能量度量进行求和而计算的总能量值来对音频对象中的所有音频对象确定总体重要性度量;对音频对象中的每个音频对象确定估计的量化位深和量化误差;对音频对象中的所有音频对象计算总噪声度量,总噪声度量至少部分地基于与估计的量化位深相对应的总量化误差;计算与总噪声度量和总能量值相对应的总信噪比;并且通过将信噪比阈值应用于总信噪比来对音频对象中的每个音频对象确定最终量化位深。
-
公开(公告)号:CN104995676A
公开(公告)日:2015-10-21
申请号:CN201480008604.9
申请日:2014-01-22
Applicant: 杜比实验室特许公司
IPC: G10L19/008 , G10L19/02 , H04S3/00 , H04S5/00
Abstract: 音频处理方法可包含接收对应于多个音频通道的音频数据。音频数据可包括对应于音频编码或处理系统的滤波器组系数的频域表示。去相关处理可利用与由音频编码或处理系统使用的滤波器组系数相同的滤波器组系数来执行。去相关处理可在不将频域表示的系数转换成另一频域或时域表示的情况下被执行。去相关处理可包含特定通道和/或特定频带的选择性和/或信号自适应去相关。去相关处理可包含将去相关滤波器应用于所接收的音频数据的一部分以产生经滤波的音频数据。去相关处理可包含使用非分层混合器以根据空间参数将所接收的音频数据的直接部分与经滤波的音频数据进行组合。
-
公开(公告)号:CN104995676B
公开(公告)日:2018-03-30
申请号:CN201480008604.9
申请日:2014-01-22
Applicant: 杜比实验室特许公司
Abstract: 音频处理方法可包含接收对应于多个音频通道的音频数据。音频数据可包括对应于音频编码或处理系统的滤波器组系数的频域表示。去相关处理可利用与由音频编码或处理系统使用的滤波器组系数相同的滤波器组系数来执行。去相关处理可在不将频域表示的系数转换成另一频域或时域表示的情况下被执行。去相关处理可包含特定通道和/或特定频带的选择性和/或信号自适应去相关。去相关处理可包含将去相关滤波器应用于所接收的音频数据的一部分以产生经滤波的音频数据。去相关处理可包含使用非分层混合器以根据空间参数将所接收的音频数据的直接部分与经滤波的音频数据进行组合。
-
-
-
-
-
-