-
公开(公告)号:CN117768832A
公开(公告)日:2024-03-26
申请号:CN202311226348.8
申请日:2023-09-22
Applicant: 苹果公司
IPC: H04S7/00 , G10L19/008
Abstract: 本公开涉及用于高效编码场景位置的方法和系统。一种方法包括:接收位流,该位流包括:与3D场景内的声源相关联的音频信号的编码版本,包括相对于第二场景的原点的第一场景的原点的场景树结构,和该声源在第一场景内的相对于第一场景的原点的位置,其中该位置使用标识符来引用第一场景的原点,其中该场景树结构定义声源相对于第一和第二场景的初始配置;确定收听者的位置;通过根据声源相对于收听者的位置的位置将音频信号在空间上渲染来产生一组空间渲染音频信号;以及使用该空间渲染音频信号来驱动扬声器。
-
公开(公告)号:CN119068885A
公开(公告)日:2024-12-03
申请号:CN202410706187.0
申请日:2024-06-03
Applicant: 苹果公司
IPC: G10L19/008 , G10L19/24 , H04S7/00
Abstract: 本公开涉及用于对音频数据进行编码的方法和系统。一种方法包括解码器侧方法,该解码器侧方法包括:接收码流,该码流包括输入音频信号的编码表示和与该输入音频信号相关联的元数据;通过使用基于匹配追踪(MP)编码的算法对编码表示进行解码来产生输入音频信号的解码表示;通过基于元数据渲染输入音频信号来产生音频驱动信号;以及使用音频驱动信号来驱动扬声器。
-
公开(公告)号:CN119068884A
公开(公告)日:2024-12-03
申请号:CN202410649977.X
申请日:2024-05-24
Applicant: 苹果公司
IPC: G10L19/008 , G10L19/032
Abstract: 本公开涉及变换域中瞬变的高效编码。本公开的各方面提供用于对具有瞬变音频声音的音频信号进行编码的改进的技术。改进的技术包括将预定长度的音频样本的帧解析成一系列更小尺寸的窗口,以及将时域样本的窗口变换成一系列频域样本的窗口。可根据对准模式来组织频域样本,且可相对于所组织的频域样本的包络来编码频域样本。
-
公开(公告)号:CN112562696B
公开(公告)日:2024-08-09
申请号:CN202010824443.8
申请日:2020-08-17
Applicant: 苹果公司
IPC: G10L19/008 , G10L19/02 , G10L19/16 , G10L19/26
Abstract: 本公开涉及具有离散对象的音频的分层编码。具有第一组高保真度立体声响复制音频分量的第一层数据能够被解码,其中该第一组高保真度立体声响复制音频分量是基于环境和一个或多个基于对象的音频信号生成的。具有该一个或多个基于对象的音频信号中的至少一个基于对象的音频信号的第二层数据被解码。从该第一组高保真度立体声响复制音频分量中减去该基于对象的音频信号中的一个基于对象的音频信号。渲染所得的高保真度立体声响复制音频分量以生成第一组音频声道。一个或多个基于对象的音频信号被空间地渲染以生成第二组音频声道。其他方面也有所描述并受权利要求书保护。
-
公开(公告)号:CN117750293A
公开(公告)日:2024-03-22
申请号:CN202311198575.4
申请日:2023-09-18
Applicant: 苹果公司
IPC: H04S7/00 , G10L19/008
Abstract: 本公开涉及对象音频编码。在一个方面,一种计算机实现的方法包括:获得对象音频和在空间上描述该对象音频的元数据;基于该元数据将该对象音频转换为时频域高保真度立体声响复制音频;以及将该时频域高保真度立体声响复制音频和该元数据的子集编码为一个或多个比特流,该一个或多个比特流将存储在计算机可读存储器中或传输到远程设备。
-
公开(公告)号:CN117746873A
公开(公告)日:2024-03-22
申请号:CN202311215265.9
申请日:2023-09-20
Applicant: 苹果公司
IPC: G10L19/00 , G10L19/008
Abstract: 本公开涉及用于推迟音频分量的响度调整的方法和系统。本发明公开了一种方法,包括:接收与音频场景相关联的音频分量,该音频分量包括音频信号;基于该音频信号来确定该音频分量的响度水平;接收该音频分量的目标响度水平;通过对该音频信号进行编码并且包括具有该响度水平和该目标响度水平的元数据来产生具有该音频分量的比特流;以及向电子设备传输该比特流。
-
公开(公告)号:CN115842984A
公开(公告)日:2023-03-24
申请号:CN202211151906.4
申请日:2022-09-21
Applicant: 苹果公司
Inventor: P·莫盖 , J·E·阿瑟 , J·D·阿特金斯 , J·O·梅里马 , D·森 , B·J·莱斯 , A·辛格阿尔瓦拉多 , J·D·谢弗 , B·伯纳德 , D·E·罗姆布洛姆
IPC: H04R3/00
Abstract: 本公开涉及确定虚拟聆听环境。可以基于由设备的一个或多个传感器捕获的传感器信号来确定用户的当前声学环境的一个或多个声学参数。可以基于该用户的该当前声学环境的该一个或多个声学参数和包括音频信号的音频文件的声学环境来确定一个或多个预设声学参数,该音频文件的该声学环境是基于该音频文件的该音频信号或该音频文件的元数据确定的。可以通过将包括该一个或多个预设声学参数的空间滤波器应用到该音频信号,在空间上渲染该音频信号,从而产生双耳音频信号。该双耳音频信号可用于驱动头戴式耳机的扬声器。其他方面也有所描述并受权利要求书保护。
-
公开(公告)号:CN112562696A
公开(公告)日:2021-03-26
申请号:CN202010824443.8
申请日:2020-08-17
Applicant: 苹果公司
IPC: G10L19/008 , G10L19/02 , G10L19/16 , G10L19/26
Abstract: 本公开涉及具有离散对象的音频的分层编码。具有第一组高保真度立体声响复制音频分量的第一层数据能够被解码,其中该第一组高保真度立体声响复制音频分量是基于环境和一个或多个基于对象的音频信号生成的。具有该一个或多个基于对象的音频信号中的至少一个基于对象的音频信号的第二层数据被解码。从该第一组高保真度立体声响复制音频分量中减去该基于对象的音频信号中的一个基于对象的音频信号。渲染所得的高保真度立体声响复制音频分量以生成第一组音频声道。一个或多个基于对象的音频信号被空间地渲染以生成第二组音频声道。其他方面也有所描述并受权利要求书保护。
-
-
-
-
-
-
-