-
-
公开(公告)号:CN116709160A
公开(公告)日:2023-09-05
申请号:CN202310184560.6
申请日:2023-03-01
Applicant: 苹果公司
IPC: H04S7/00
Abstract: 本公开涉及音频场景描述和控件。本文公开了存储在存储器中的数据结构,该数据结构包括场景描述,该场景描述定义从制作者接收的数字音频内容中的场景组件的分级结构。该分级结构具有包括第四阶段的若干阶段,在该第四阶段中定义了场景组成,该场景组成包含在单个呈现中渲染该数字音频内容所需的所有场景组件,例如如该制作者所期望的那样,并且用于输入到空间音频渲染器,其中该场景组成包含一个或多个组成选择组。还描述了其他方面并要求对其他方面进行保护。
-
公开(公告)号:CN116324978A
公开(公告)日:2023-06-23
申请号:CN202180065200.3
申请日:2021-08-31
Applicant: 苹果公司
IPC: G10L19/008
Abstract: 本发明公开了一种分级空间分辨率编解码器,其在用于传送沉浸式音频内容的目标带宽改变时自适应地调整该音频内容的表示。该音频内容可由自适应数量的内容类型诸如声道/对象、更高阶高保真度立体声响复制(HOA)表示,并由自适应空间编码技术编码以支持传输声道或用户的目标比特率。自适应空间编码技术可以包括用于生成自适应数量的声道/对象的自适应声道/对象空间编码技术,以及用于生成HOA的自适应阶次的自适应HOA空间编码或HOA压缩技术。该自适应可以根据与期望质量相关联的目标比特率以及确定声道、对象和HOA的优先级的分析来进行。高优先级声道/对象可被编码到高质量比特流中,而低优先级声道/对象可被转换并编码为HOA。
-
公开(公告)号:CN119068885A
公开(公告)日:2024-12-03
申请号:CN202410706187.0
申请日:2024-06-03
Applicant: 苹果公司
IPC: G10L19/008 , G10L19/24 , H04S7/00
Abstract: 本公开涉及用于对音频数据进行编码的方法和系统。一种方法包括解码器侧方法,该解码器侧方法包括:接收码流,该码流包括输入音频信号的编码表示和与该输入音频信号相关联的元数据;通过使用基于匹配追踪(MP)编码的算法对编码表示进行解码来产生输入音频信号的解码表示;通过基于元数据渲染输入音频信号来产生音频驱动信号;以及使用音频驱动信号来驱动扬声器。
-
公开(公告)号:CN117750293A
公开(公告)日:2024-03-22
申请号:CN202311198575.4
申请日:2023-09-18
Applicant: 苹果公司
IPC: H04S7/00 , G10L19/008
Abstract: 本公开涉及对象音频编码。在一个方面,一种计算机实现的方法包括:获得对象音频和在空间上描述该对象音频的元数据;基于该元数据将该对象音频转换为时频域高保真度立体声响复制音频;以及将该时频域高保真度立体声响复制音频和该元数据的子集编码为一个或多个比特流,该一个或多个比特流将存储在计算机可读存储器中或传输到远程设备。
-
公开(公告)号:CN119071713A
公开(公告)日:2024-12-03
申请号:CN202410695717.6
申请日:2024-05-31
Applicant: 苹果公司
Abstract: 本公开提供了一种用于空间音频渲染的元数据。本公开的各个方面在此使得内容创建侧能够控制构成声音程序的离散音频对象如何被解码侧渲染以实现更强的真实感,同时使得解码器侧还能够控制渲染过程以将对象的方位和取向视为相对于收听者的虚拟声源。因此,可以通过各种解码器侧格式来最优地渲染同一声音程序,诸如耳机上的双路立体声、嵌入在设备中的立体声扬声器对上的串音消除的双路立体声、或者沉浸式扬声器布局上的多声道,例如平面(planar)诸如5.1和7.1环绕声布局、3D诸如7.1.4或22.2等。还描述并要求保护其他方面。
-
公开(公告)号:CN119071712A
公开(公告)日:2024-12-03
申请号:CN202410692896.8
申请日:2024-05-31
Applicant: 苹果公司
Abstract: 本公开涉及用于空间音频渲染的元数据中的掩蔽区,各个方面使得内容创建侧能够控制声音节目如何由解码侧进行空间音频渲染,使得元数据指定的三维声学掩蔽区中的音频场景分量不被听到,而该声音节目的未掩蔽区中的另一音频场景分量被回放的听众听到。还描述了其他方面并要求对其他方面进行保护。
-
公开(公告)号:CN116324980A
公开(公告)日:2023-06-23
申请号:CN202180065769.X
申请日:2021-09-10
Applicant: 苹果公司
IPC: G10L19/24
Abstract: 本发明公开了用于对沉浸式音频内容进行解码的方法和系统,该沉浸式音频内容由用于声道、音频对象、高阶高保真度立体声响复制(HOA)和/或其他声场表示的自适应数量的场景元素编码。经解码的音频被呈现给回放设备的扬声器配置。对于使用连续帧中的声道、对象、和/或HOA的不同混合来表示音频场景的位流,能够执行新帧的淡入和旧帧的淡出。连续帧之间的交叉淡入淡出发生在:渲染之后的扬声器布局中、渲染之前的经空间解码的内容类型中、或作为基线解码器的输出但在空间解码和渲染之前的输送声道之间。交叉淡入淡出能够针对转换帧使用立即淡入和淡出帧(IFFF),或者能够使用诸如MDCT的时域混叠消除(TDAC)的重叠相加合成技术。
-
-
-
-
-
-
-