-
-
公开(公告)号:CN116830192A
公开(公告)日:2023-09-29
申请号:CN202180091875.5
申请日:2021-12-02
IPC: G10L19/008
Abstract: 公开了一种音频信号编码/解码方法,该方法使用应用于编码器处的编码下混策略,该编码下混策略不同于应用于解码器处的解码重混/上混策略。基于下混编解码方案的类型,该方法包括:计算要被应用于输入音频信号的输入下混增益,以构造主下混通道;确定下混缩放增益,以缩放主下混通道;基于输入音频信号、输入下混增益和下混缩放增益生成预测增益;通过使用主下混通道和预测增益生成侧通道预测,并从侧通道中减去侧通道预测来确定来自侧通道的剩余通道;基于剩余通道中的能量确定解相关增益;编码主下混通道、剩余通道、预测增益和解相关增益;以及将比特流发送到解码器。
-
公开(公告)号:CN116097350A
公开(公告)日:2023-05-09
申请号:CN202180057963.3
申请日:2021-06-10
Applicant: 杜比实验室特许公司
IPC: G10L19/008
Abstract: 描述了一种对输入信号的元数据进行逐帧编码的方法,元数据包括能从输入信号计算的多个至少部分地相关的参数。方法包括针对每个帧:通过使用循环过程迭代地执行以下步骤:从多个处理策略中确定用于计算并量化参数的处理策略;基于所确定的处理策略计算并量化参数以获得已量化参数;以及对已量化参数进行编码。特别地,多个处理策略中的每一个包括指示与各个参数的计算和量化有关的排序的相应第一指示;并且处理策略是基于至少一个比特率阈值来确定的。
-
公开(公告)号:CN114631141A
公开(公告)日:2022-06-14
申请号:CN202080076679.6
申请日:2020-10-29
Applicant: 杜比实验室特许公司
Inventor: D·S·麦格拉思
IPC: G10L19/008
Abstract: 本公开涉及处理空间音频信号以生成该空间音频信号的压缩表示的方法。该方法包括:分析该空间音频信号以确定一或多个音频元素的到达方向;针对至少一个频率子带,确定与该到达方向相关联的信号功率的相应指示;生成包括方向信息和能量信息的元数据,该方向信息包括该音频元素的到达方向的指示,该能量信息包括信号功率的相应指示;基于该空间音频信号来生成具有预定义数量的通道的基于通道的音频信号;及输出该基于通道的音频信号及该元数据作为该压缩表示。本公开进一步涉及处理空间音频信号的压缩表示以生成该空间音频信号的重构表示的方法和对应的设备、程序以及储存媒体。
-
公开(公告)号:CN110800048A
公开(公告)日:2020-02-14
申请号:CN201880041822.0
申请日:2018-05-02
Applicant: 杜比实验室特许公司
Inventor: D·S·麦格拉思
IPC: G10L19/008 , H04S3/00 , G10L19/16 , H04S3/02
Abstract: 本发明提供用于处理多通道空间音频格式输入信号的设备、计算机可读媒体和方法。举例来说,一种此类方法包括基于所接收的空间音频格式输入信号确定对象方位元数据;和基于所述所接收的空间音频格式输入信号提取对象音频信号,其中所述基于所述所接收的空间音频格式输入信号提取对象音频信号包含确定对象音频信号和残余音频信号。
-
公开(公告)号:CN112970270B
公开(公告)日:2023-10-13
申请号:CN201980071861.X
申请日:2019-11-12
Abstract: 本公开大体上涉及音频场景的定向音频的捕获、声学预处理、编码、解码及呈现。特定来说,本公开涉及一种适于响应于捕获所述定向音频的麦克风系统的空间数据修改捕获的定向音频的定向性质的装置。本公开进一步涉及经配置以响应于接收的空间数据修改接收的定向音频的定向性质的呈现装置。
-
公开(公告)号:CN116670758A
公开(公告)日:2023-08-29
申请号:CN202180080992.1
申请日:2021-12-02
IPC: G10L19/008
Abstract: 本发明提供一种用于编码基于场景的音频的方法。在一些实施方案中,所述方法涉及由编码器确定输入音频信号的帧中的主要声音分量的空间方向。在一些实施方案中,所述方法涉及基于所述所确定空间方向及要用于编码所述输入音频信号的编码方案的方向偏好来确定旋转参数。在一些实施方案中,所述方法涉及基于所述旋转参数旋转所述帧的声音分量,使得在旋转之后,所述主要声音分量具有与所述编码方案的所述方向偏好对准的空间方向。在一些实施方案中,所述方法涉及结合所述旋转参数的指示或所述主要声音分量的所述空间方向的指示,使用所述编码方案编码所述输入音频信号的所述帧的所述经旋转声音分量。
-
公开(公告)号:CN111630593B
公开(公告)日:2021-12-28
申请号:CN201980009156.7
申请日:2019-01-17
IPC: G10L19/008
Abstract: 本文档描述了一种用于对描述参考位置处的声场的声场表示SR输入信号(101,301)进行编码的方法(400);其中所述SR输入信号(101,301)包括所述参考位置处的所述声场的多个不同指向性图案的多个声道。所述方法(400)包括从所述SR输入信号(101,301)提取(401)一或多个音频对象(103,303)。此外,所述方法(400)包括基于所述SR输入信号(101,301)并基于所述一或多个音频对象(103,303)来确定(402)残差信号(102,302)。所述方法(400)还包括进行所述一或多个音频对象(103,303)和/或所述残差信号(102,302)的联合译码。另外,所述方法(400)包括基于在所述一或多个音频对象(103,303)和/或所述残差信号(102,302)的联合译码的背景下生成的数据来生成(403)位流(701)。
-
公开(公告)号:CN111630593A
公开(公告)日:2020-09-04
申请号:CN201980009156.7
申请日:2019-01-17
IPC: G10L19/008
Abstract: 本文档描述了一种用于对描述参考位置处的声场的声场表示SR输入信号(101,301)进行编码的方法(400);其中所述SR输入信号(101,301)包括所述参考位置处的所述声场的多个不同指向性图案的多个声道。所述方法(400)包括从所述SR输入信号(101,301)提取(401)一或多个音频对象(103,303)。此外,所述方法(400)包括基于所述SR输入信号(101,301)并基于所述一或多个音频对象(103,303)来确定(402)残差信号(102,302)。所述方法(400)还包括进行所述一或多个音频对象(103,303)和/或所述残差信号(102,302)的联合译码。另外,所述方法(400)包括基于在所述一或多个音频对象(103,303)和/或所述残差信号(102,302)的联合译码的背景下生成的数据来生成(403)位流(701)。
-
公开(公告)号:CN110771181A
公开(公告)日:2020-02-07
申请号:CN201880039287.5
申请日:2018-05-14
Applicant: 杜比实验室特许公司
Inventor: D·S·麦格拉思
Abstract: 本发明涉及一种将中间信号格式的音频信号转换为适于由扬声器阵列播放的一组扬声器馈送的方法。所述中间信号格式的所述音频信号可以借助空间平移函数从输入音频信号获得。所述方法包括:确定所述扬声器阵列的离散平移函数;基于所述离散平移函数确定目标平移函数;其中确定所述目标平移函数涉及平滑所述离散平移函数;及基于所述目标平移函数和所述空间平移函数,确定用于将所述中间信号格式的所述音频信号转换为所述组扬声器馈送的渲染操作。本发明进一步涉及一种对应设备和一种对应计算机可读存储媒体。
-
-
-
-
-
-
-
-
-