确定混合音频信号的对话质量度量

    公开(公告)号:CN116686047A

    公开(公告)日:2023-09-01

    申请号:CN202280009038.8

    申请日:2022-01-04

    Abstract: 公开了一种用于确定包括对话分量和噪声分量的混合音频信号的一个或多个对话质量度量的方法,该方法包括通过对话分离器使用对话分离模型从混合音频信号中分离出估计的对话分量,该对话分离模型通过基于一个或多个质量度量训练对话分离器而被确定;将所估计的对话分量从对话分离器提供给质量度量估计器;以及通过质量度量估计器基于混合信号和估计的对话分量来确定一个或多个质量度量。还公开了一种用于训练对话分离器的方法、一种包括被配置为执行该方法的电路的系统、以及一种非暂时性计算机可读存储介质。

    处理参数编码的音频
    32.
    发明公开

    公开(公告)号:CN116171474A

    公开(公告)日:2023-05-26

    申请号:CN202180061795.5

    申请日:2021-09-07

    Abstract: 一种方法包括接收用于第一参数编码的输入音频信号的第一输入位流,该第一输入位流包括表示第一输入核心音频信号和包括与第一参数编码的输入音频信号相关的至少一个空间参数的第一集合的数据。第一参数编码的音频信号的第一协方差矩阵是基于第一集合的(一个或多个)空间参数来确定的。基于所确定的第一协方差矩阵来确定包括至少一个空间参数的修改集合,其中修改集合与第一集合不同。确定基于第一输入核心音频信号或由第一输入核心音频信号构成的输出核心音频信号。生成用于参数编码的输出音频信号的输出位流,该输出位流包括表示输出核心音频信号和修改集合的数据。

    音频解码器和解码方法
    34.
    发明公开

    公开(公告)号:CN108353242A

    公开(公告)日:2018-07-31

    申请号:CN201680062186.0

    申请日:2016-08-23

    Abstract: 一种用于将音频声道或对象的第二呈现表示为数据流的方法,该方法包括以下步骤:(a)提供基本信号的集合,基本信号表示音频声道或对象的第一呈现;(b)提供变换参数的集合,变换参数意图将第一呈现变换为第二呈现;变换参数进一步是针对至少两个频带指定的,并且包括用于频带中的至少一个的多抽头卷积矩阵参数的集合。

    用于设计和应用数值优化的双耳房间脉冲响应的方法和系统

    公开(公告)号:CN105900457B

    公开(公告)日:2017-08-15

    申请号:CN201480071994.4

    申请日:2014-12-23

    Abstract: 用于设计用于在耳机虚拟器中使用的双耳房间脉冲响应(BRIR)的方法和系统、以及用于响应于多声道音频信号的一组声道产生双耳信号(包括通过将BRIR应用于该组的每个声道),由此产生滤波信号,并且组合滤波信号以产生双耳信号的方法和系统,其中,每个BRIR已根据设计方法的实施例被设计。其它方面是被配置为执行本发明方法的任何实施例的音频处理单元。根据一些实施例,BRIR设计被归结为基于仿真模型(其产生候选BRIR)和至少一个目标函数(其评估每个候选BRIR)的数值优化问题,并且包括识别候选BRIR中由通过每个目标函数对于候选BRIR确定的性能度量所指示的最佳的一个。

    空间上的弥漫性或大音频对象的处理

    公开(公告)号:CN105431900A

    公开(公告)日:2016-03-23

    申请号:CN201480043090.0

    申请日:2014-07-24

    Abstract: 弥漫性或空间上的大音频对象可被识别以进行特殊处理。去相关过程可以对对应于大音频对象的音频信号执行,以产生去相关的大音频对象音频信号。这些去相关的大音频对象音频信号可以与对象位置关联,对象位置可以是固定的或随时间变化的位置。例如,去相关的大音频对象音频信号可以被渲染到虚拟或实际扬声器位置。这种渲染过程的输出可以被输入到场景简化过程。去相关、关联和/或场景简化过程可以在编码音频数据的过程之前执行。

Patent Agency Ranking