-
公开(公告)号:CN116686047A
公开(公告)日:2023-09-01
申请号:CN202280009038.8
申请日:2022-01-04
Applicant: 杜比实验室特许公司
IPC: G10L21/0272
Abstract: 公开了一种用于确定包括对话分量和噪声分量的混合音频信号的一个或多个对话质量度量的方法,该方法包括通过对话分离器使用对话分离模型从混合音频信号中分离出估计的对话分量,该对话分离模型通过基于一个或多个质量度量训练对话分离器而被确定;将所估计的对话分量从对话分离器提供给质量度量估计器;以及通过质量度量估计器基于混合信号和估计的对话分量来确定一个或多个质量度量。还公开了一种用于训练对话分离器的方法、一种包括被配置为执行该方法的电路的系统、以及一种非暂时性计算机可读存储介质。
-
公开(公告)号:CN116171474A
公开(公告)日:2023-05-26
申请号:CN202180061795.5
申请日:2021-09-07
IPC: G10L19/16
Abstract: 一种方法包括接收用于第一参数编码的输入音频信号的第一输入位流,该第一输入位流包括表示第一输入核心音频信号和包括与第一参数编码的输入音频信号相关的至少一个空间参数的第一集合的数据。第一参数编码的音频信号的第一协方差矩阵是基于第一集合的(一个或多个)空间参数来确定的。基于所确定的第一协方差矩阵来确定包括至少一个空间参数的修改集合,其中修改集合与第一集合不同。确定基于第一输入核心音频信号或由第一输入核心音频信号构成的输出核心音频信号。生成用于参数编码的输出音频信号的输出位流,该输出位流包括表示输出核心音频信号和修改集合的数据。
-
公开(公告)号:CN114503608A
公开(公告)日:2022-05-13
申请号:CN202080066709.5
申请日:2020-09-22
Applicant: 杜比实验室特许公司
Abstract: 编码/解码技术,其中多个变换参数集与输入音频内容的被渲染回放呈现一起被编码。在解码器侧使用多个变换参数来变换该回放呈现,以提供对于个体收听者相对于他们的听觉简档而优化的个性化双耳回放呈现。这可以通过选择或组合元数据流中存在的数据来实现。
-
公开(公告)号:CN108353242A
公开(公告)日:2018-07-31
申请号:CN201680062186.0
申请日:2016-08-23
IPC: H04S7/00
Abstract: 一种用于将音频声道或对象的第二呈现表示为数据流的方法,该方法包括以下步骤:(a)提供基本信号的集合,基本信号表示音频声道或对象的第一呈现;(b)提供变换参数的集合,变换参数意图将第一呈现变换为第二呈现;变换参数进一步是针对至少两个频带指定的,并且包括用于频带中的至少一个的多抽头卷积矩阵参数的集合。
-
公开(公告)号:CN108141685A
公开(公告)日:2018-06-08
申请号:CN201680062138.1
申请日:2016-08-24
Abstract: 一种用于对输入音频流进行编码的方法包括以下步骤:获得输入音频流的意图用于在第一音频再现系统上再现的第一回放流呈现;获得输入音频流的意图用于在第二音频再现系统上再现的第二回放流呈现;确定适合于将中间回放流呈现变换为第二回放流呈现的近似的变换参数的集合,其中,变换参数是通过最小化第二回放流呈现的近似和第二回放流呈现之间的差异的测度确定的;并且对第一回放流呈现和变换参数的集合进行编码以用于发送到解码器。
-
公开(公告)号:CN105900457B
公开(公告)日:2017-08-15
申请号:CN201480071994.4
申请日:2014-12-23
Applicant: 杜比实验室特许公司
IPC: H04S7/00
CPC classification number: H04S7/304 , H04S7/306 , H04S2400/03 , H04S2420/01 , H04S2420/07
Abstract: 用于设计用于在耳机虚拟器中使用的双耳房间脉冲响应(BRIR)的方法和系统、以及用于响应于多声道音频信号的一组声道产生双耳信号(包括通过将BRIR应用于该组的每个声道),由此产生滤波信号,并且组合滤波信号以产生双耳信号的方法和系统,其中,每个BRIR已根据设计方法的实施例被设计。其它方面是被配置为执行本发明方法的任何实施例的音频处理单元。根据一些实施例,BRIR设计被归结为基于仿真模型(其产生候选BRIR)和至少一个目标函数(其评估每个候选BRIR)的数值优化问题,并且包括识别候选BRIR中由通过每个目标函数对于候选BRIR确定的性能度量所指示的最佳的一个。
-
公开(公告)号:CN105900169A
公开(公告)日:2016-08-24
申请号:CN201580004002.0
申请日:2015-01-05
IPC: G10L19/008 , G10L25/48 , H04S3/00 , H04S7/00
Abstract: 确定存在于一个或多个帧中的输入音频内容中的音频对象。还确定存在于所述一个或多个帧中的输出音频内容中的输出聚类。这里,输入音频内容中的音频对象被转换成输出音频内容中的输出聚类。至少部分基于音频对象的位置元数据和输出聚类的位置元数据来计算一个或多个空间误差度量。
-
公开(公告)号:CN105431900A
公开(公告)日:2016-03-23
申请号:CN201480043090.0
申请日:2014-07-24
IPC: G10L19/008 , H04S3/00
Abstract: 弥漫性或空间上的大音频对象可被识别以进行特殊处理。去相关过程可以对对应于大音频对象的音频信号执行,以产生去相关的大音频对象音频信号。这些去相关的大音频对象音频信号可以与对象位置关联,对象位置可以是固定的或随时间变化的位置。例如,去相关的大音频对象音频信号可以被渲染到虚拟或实际扬声器位置。这种渲染过程的输出可以被输入到场景简化过程。去相关、关联和/或场景简化过程可以在编码音频数据的过程之前执行。
-
-
-
-
-
-
-