-
公开(公告)号:CN112105902A
公开(公告)日:2020-12-18
申请号:CN201980030729.4
申请日:2019-04-10
Applicant: 杜比实验室特许公司
Abstract: 提供了用于训练神经网络以及用于通过训练的神经网络来实现音频编码器和解码器的计算机实现的方法。神经网络可以接收输入音频信号,生成编码音频信号并且对编码音频信号进行解码。损失函数生成模块可以接收解码音频信号和真值音频信号,并且可以生成与解码音频信号相对应的损失函数值。生成损失函数值可涉及应用心理声学模型。可以基于损失函数值来训练神经网络。训练可涉及更新神经网络的至少一个权重。
-
公开(公告)号:CN115410583A
公开(公告)日:2022-11-29
申请号:CN202210834906.8
申请日:2019-04-10
Applicant: 杜比实验室特许公司
Abstract: 本公开涉及基于机器学习的用于音频编码和解码的基于感知的损失函数。提供了用于训练神经网络以及用于通过训练的神经网络来实现音频编码器和解码器的计算机实现的方法。神经网络可以接收输入音频信号,生成编码音频信号并且对编码音频信号进行解码。损失函数生成模块可以接收解码音频信号和真值音频信号,并且可以生成与解码音频信号相对应的损失函数值。生成损失函数值可涉及应用心理声学模型。可以基于损失函数值来训练神经网络。训练可涉及更新神经网络的至少一个权重。
-
公开(公告)号:CN112105902B
公开(公告)日:2022-07-22
申请号:CN201980030729.4
申请日:2019-04-10
Applicant: 杜比实验室特许公司
Abstract: 提供了用于训练神经网络以及用于通过训练的神经网络来实现音频编码器和解码器的计算机实现的方法。神经网络可以接收输入音频信号,生成编码音频信号并且对编码音频信号进行解码。损失函数生成模块可以接收解码音频信号和真值音频信号,并且可以生成与解码音频信号相对应的损失函数值。生成损失函数值可涉及应用心理声学模型。可以基于损失函数值来训练神经网络。训练可涉及更新神经网络的至少一个权重。
-
公开(公告)号:CN106463125B
公开(公告)日:2020-09-15
申请号:CN201580022101.1
申请日:2015-04-23
Applicant: 杜比实验室特许公司
IPC: G10L19/008
Abstract: 编码自适应音频的方法包括:接收N个对象以及相关联的描述这些对象的持续运动的空间元数据,并且基于所述空间元数据将音频划分成段。该方法通过如下操作对具有对象和通道床的自适应音频进行编码:捕获在包含矩阵的序列的时间变化的矩阵轨迹中的N个对象的持续运动,将时变矩阵轨迹的系数编码为将经由高清晰度音频格式被发送以用于通过M个输出通道渲染自适应音频的空间元数据,以及基于所述空间元数据将矩阵的序列分割成多个子段,其中所述多个子段被配置为有助于自适应音频的一个或更多个特性的编码。
-
公开(公告)号:CN106463125A
公开(公告)日:2017-02-22
申请号:CN201580022101.1
申请日:2015-04-23
Applicant: 杜比实验室特许公司
IPC: G10L19/008
Abstract: 编码自适应音频的方法包括:接收N个对象以及相关联的描述这些对象的持续运动的空间元数据,并且基于所述空间元数据将音频划分成段。该方法通过如下操作对具有对象和通道床的自适应音频进行编码:捕获在包含矩阵的序列的时间变化的矩阵轨迹中的N个对象的持续运动,将时变矩阵轨迹的系数编码为将经由高清晰度音频格式被发送以用于通过M个输出通道渲染自适应音频的空间元数据,以及基于所述空间元数据将矩阵的序列分割成多个子段,其中所述多个子段被配置为有助于自适应音频的一个或更多个特性的编码。
-
-
-
-