-
公开(公告)号:CN116709160A
公开(公告)日:2023-09-05
申请号:CN202310184560.6
申请日:2023-03-01
Applicant: 苹果公司
IPC: H04S7/00
Abstract: 本公开涉及音频场景描述和控件。本文公开了存储在存储器中的数据结构,该数据结构包括场景描述,该场景描述定义从制作者接收的数字音频内容中的场景组件的分级结构。该分级结构具有包括第四阶段的若干阶段,在该第四阶段中定义了场景组成,该场景组成包含在单个呈现中渲染该数字音频内容所需的所有场景组件,例如如该制作者所期望的那样,并且用于输入到空间音频渲染器,其中该场景组成包含一个或多个组成选择组。还描述了其他方面并要求对其他方面进行保护。
-
-
公开(公告)号:CN116324978A
公开(公告)日:2023-06-23
申请号:CN202180065200.3
申请日:2021-08-31
Applicant: 苹果公司
IPC: G10L19/008
Abstract: 本发明公开了一种分级空间分辨率编解码器,其在用于传送沉浸式音频内容的目标带宽改变时自适应地调整该音频内容的表示。该音频内容可由自适应数量的内容类型诸如声道/对象、更高阶高保真度立体声响复制(HOA)表示,并由自适应空间编码技术编码以支持传输声道或用户的目标比特率。自适应空间编码技术可以包括用于生成自适应数量的声道/对象的自适应声道/对象空间编码技术,以及用于生成HOA的自适应阶次的自适应HOA空间编码或HOA压缩技术。该自适应可以根据与期望质量相关联的目标比特率以及确定声道、对象和HOA的优先级的分析来进行。高优先级声道/对象可被编码到高质量比特流中,而低优先级声道/对象可被转换并编码为HOA。
-
公开(公告)号:CN112153530A
公开(公告)日:2020-12-29
申请号:CN202010591439.1
申请日:2020-06-24
Applicant: 苹果公司
Abstract: 本公开涉及用于存储捕获元数据的空间音频文件格式。一种具有麦克风的设备能够在音频录制期间生成麦克风信号。该设备能够在电子音频数据文件中存储该麦克风信号和元数据,该元数据包括该麦克风的脉冲响应。其他方面也有所描述并受权利要求书保护。
-
公开(公告)号:CN119071713A
公开(公告)日:2024-12-03
申请号:CN202410695717.6
申请日:2024-05-31
Applicant: 苹果公司
Abstract: 本公开提供了一种用于空间音频渲染的元数据。本公开的各个方面在此使得内容创建侧能够控制构成声音程序的离散音频对象如何被解码侧渲染以实现更强的真实感,同时使得解码器侧还能够控制渲染过程以将对象的方位和取向视为相对于收听者的虚拟声源。因此,可以通过各种解码器侧格式来最优地渲染同一声音程序,诸如耳机上的双路立体声、嵌入在设备中的立体声扬声器对上的串音消除的双路立体声、或者沉浸式扬声器布局上的多声道,例如平面(planar)诸如5.1和7.1环绕声布局、3D诸如7.1.4或22.2等。还描述并要求保护其他方面。
-
公开(公告)号:CN119071712A
公开(公告)日:2024-12-03
申请号:CN202410692896.8
申请日:2024-05-31
Applicant: 苹果公司
Abstract: 本公开涉及用于空间音频渲染的元数据中的掩蔽区,各个方面使得内容创建侧能够控制声音节目如何由解码侧进行空间音频渲染,使得元数据指定的三维声学掩蔽区中的音频场景分量不被听到,而该声音节目的未掩蔽区中的另一音频场景分量被回放的听众听到。还描述了其他方面并要求对其他方面进行保护。
-
公开(公告)号:CN119068888A
公开(公告)日:2024-12-03
申请号:CN202410650441.X
申请日:2024-05-24
Applicant: 苹果公司
IPC: G10L19/032
Abstract: 本公开涉及去相关的频谱系数的向量量化。本公开的各方面提供用于对具有瞬变音频声音的音频信号进行编码的改进技术。改进的技术包括将预定长度的音频样本的帧解析成一系列更小尺寸的窗口,以及将时域样本的窗口变换成一系列频域样本的窗口。在一方面中,频域样本的编码可包括由跨帧选择的频域样本形成的向量的向量量化。
-
公开(公告)号:CN116324980A
公开(公告)日:2023-06-23
申请号:CN202180065769.X
申请日:2021-09-10
Applicant: 苹果公司
IPC: G10L19/24
Abstract: 本发明公开了用于对沉浸式音频内容进行解码的方法和系统,该沉浸式音频内容由用于声道、音频对象、高阶高保真度立体声响复制(HOA)和/或其他声场表示的自适应数量的场景元素编码。经解码的音频被呈现给回放设备的扬声器配置。对于使用连续帧中的声道、对象、和/或HOA的不同混合来表示音频场景的位流,能够执行新帧的淡入和旧帧的淡出。连续帧之间的交叉淡入淡出发生在:渲染之后的扬声器布局中、渲染之前的经空间解码的内容类型中、或作为基线解码器的输出但在空间解码和渲染之前的输送声道之间。交叉淡入淡出能够针对转换帧使用立即淡入和淡出帧(IFFF),或者能够使用诸如MDCT的时域混叠消除(TDAC)的重叠相加合成技术。
-
公开(公告)号:CN112153530B
公开(公告)日:2022-05-27
申请号:CN202010591439.1
申请日:2020-06-24
Applicant: 苹果公司
Abstract: 本公开涉及用于存储捕获元数据的空间音频文件格式。一种具有麦克风的设备能够在音频录制期间生成麦克风信号。该设备能够在电子音频数据文件中存储该麦克风信号和元数据,该元数据包括该麦克风的脉冲响应。其他方面也有所描述并受权利要求书保护。
-
-
-
-
-
-
-
-