响应于多通道音频通过使用至少一个反馈延迟网络产生双耳音频

    公开(公告)号:CN111065041B

    公开(公告)日:2022-02-18

    申请号:CN201911321337.1

    申请日:2014-12-18

    Abstract: 本公开涉及响应于多通道音频通过使用至少一个反馈延迟网络产生双耳音频。在一些实施例中,提供用于响应多通道音频信号的通道产生双耳信号的虚拟化方法,这些虚拟化方法向各通道应用双耳房间脉冲响应(BRIR),包含通过使用至少一个反馈延迟网络(FDN)以向通道的下混应用公共晚期混响。在一些实施例中,输入信号通道在第一处理路径中被处理,以向各通道应用的用于该通道的单通道BRIR的直接响应和早期反射部分,并且,通道的下混在包含至少一个应用公共晚期混响的FDN的第二处理路径中被处理。典型地,公共晚期混响模仿单通道BRIR中的至少一些的晚期混响部分的共同宏观属性。其它方面是被配置为执行方法的任何实施例的耳机虚拟化器。

    用于耳机虚拟化的混响生成

    公开(公告)号:CN110809227B

    公开(公告)日:2021-04-27

    申请号:CN201911103473.3

    申请日:2016-02-11

    Abstract: 本公开涉及用于耳机虚拟化的混响生成。描述了一种生成用于耳机虚拟化的双耳房间脉冲响应(BRIR)的一个或多个分量的方法。在该方法中,生成定向控制的反射,其中定向控制的反射对与声源定位对应的音频输入信号给予期望的感知线索。然后组合至少所生成的反射来获得BRIR的一个或多个分量。还描述了对应的系统和计算机程序产品。

    用于耳机虚拟化的混响生成

    公开(公告)号:CN110809227A

    公开(公告)日:2020-02-18

    申请号:CN201911103473.3

    申请日:2016-02-11

    Abstract: 本公开涉及用于耳机虚拟化的混响生成。描述了一种生成用于耳机虚拟化的双耳房间脉冲响应(BRIR)的一个或多个分量的方法。在该方法中,生成定向控制的反射,其中定向控制的反射对与声源定位对应的音频输入信号给予期望的感知线索。然后组合至少所生成的反射来获得BRIR的一个或多个分量。还描述了对应的系统和计算机程序产品。

    响应于多通道音频通过使用至少一个反馈延迟网络产生双耳音频

    公开(公告)号:CN107835483A

    公开(公告)日:2018-03-23

    申请号:CN201711094063.8

    申请日:2014-12-18

    Abstract: 本公开涉及响应于多通道音频通过使用至少一个反馈延迟网络产生双耳音频。在一些实施例中,提供用于响应多通道音频信号的通道产生双耳信号的虚拟化方法,这些虚拟化方法向各通道应用双耳房间脉冲响应(BRIR),包含通过使用至少一个反馈延迟网络(FDN)以向通道的下混应用公共晚期混响。在一些实施例中,输入信号通道在第一处理路径中被处理,以向各通道应用的用于该通道的单通道BRIR的直接响应和早期反射部分,并且,通道的下混在包含至少一个应用公共晚期混响的FDN的第二处理路径中被处理。典型地,公共晚期混响模仿单通道BRIR中的至少一些的晚期混响部分的共同宏观属性。其它方面是被配置为执行方法的任何实施例的耳机虚拟化器。

    响应于多通道音频通过使用至少一个反馈延迟网络产生双耳音频

    公开(公告)号:CN107770718A

    公开(公告)日:2018-03-06

    申请号:CN201711094044.5

    申请日:2014-12-18

    Abstract: 本公开涉及响应于多通道音频通过使用至少一个反馈延迟网络产生双耳音频。在一些实施例中,提供用于响应多通道音频信号的通道产生双耳信号的虚拟化方法,这些虚拟化方法向各通道应用双耳房间脉冲响应(BRIR),包含通过使用至少一个反馈延迟网络(FDN)以向通道的下混应用公共晚期混响。在一些实施例中,输入信号通道在第一处理路径中被处理,以向各通道应用的用于该通道的单通道BRIR的直接响应和早期反射部分,并且,通道的下混在包含至少一个应用公共晚期混响的FDN的第二处理路径中被处理。典型地,公共晚期混响模仿单通道BRIR中的至少一些的晚期混响部分的共同宏观属性。其它方面是被配置为执行方法的任何实施例的耳机虚拟化器。

    谐度估计、音频分类、音调确定及噪声估计

    公开(公告)号:CN103325384A

    公开(公告)日:2013-09-25

    申请号:CN201210080255.4

    申请日:2012-03-23

    CPC classification number: G10L25/78 G10L25/18 G10L25/81 G10L25/84

    Abstract: 公开了用于谐度估计、音频分类、音调确定及噪声估计的实施例。根据测量音频信号的谐度的方法,计算音频信号的对数幅度谱。通过把第一谱的每个分量计算为多个频率上对数幅度谱的分量的和,来导出第一谱。在线性频率尺度上,这些频率是第一谱的分量的频率的奇数倍。通过把第二谱的每个分量计算为多个频率上对数幅度谱的分量的和,来导出第二谱。在线性频率尺度上,这些频率是第二谱的分量的频率的偶数倍。通过从第二谱中减去第一谱来导出差谱。把谐度测量生成为预定频率范围内差谱的最大分量的单调增函数值。

    声源定位设备和方法
    48.
    发明公开

    公开(公告)号:CN102809742A

    公开(公告)日:2012-12-05

    申请号:CN201110157737.0

    申请日:2011-06-01

    CPC classification number: G01S3/8034

    Abstract: 描述了声源定位设备和方法。基于通过话筒阵列获得的短时间帧数据计算帧幅度差向量。帧幅度差向量反映在记录短时间帧数据期间阵列话筒捕获的幅度之间的差。评价帧幅度差向量和多个参考帧幅度差向量中的每个之间的相似度。每个参考帧幅度差向量反映在记录来自多个候选位置之一的声音期间阵列话筒捕获的幅度之间的差。至少基于候选位置和相关的相似度估计声源的期望位置。能够至少基于幅度差来进行声源定位。

    用于在捕获时进行对象渲染的视听分析

    公开(公告)号:CN119856498A

    公开(公告)日:2025-04-18

    申请号:CN202380065259.1

    申请日:2023-09-12

    Abstract: 公开了一种用于生成用于在捕获时对象渲染的自动视听分析的系统和方法。一个示例提供了一种处理视听内容的方法。该方法包括:接收包括多个音频帧和多个视频帧的内容;将多个音频帧中的每一个音频帧分类为多个音频分类;以及将多个视频帧中的每一个视频帧分类为多个视频分类。该方法包括:基于相应音频分类来处理多个音频帧;以及基于相应视频分类来处理多个视频帧。每个音频分类用不同的音频处理操作来处理,并且每个视频分类用不同的视频处理操作来处理。该方法包括通过合并经处理的多个音频帧和经处理的多个视频帧来生成该内容的音频/视频表示。

    音频对象分离和处理音频
    50.
    发明公开

    公开(公告)号:CN119790458A

    公开(公告)日:2025-04-08

    申请号:CN202380060928.6

    申请日:2023-08-18

    Abstract: 公开了一种用于分离混合音频信号中的音频对象的方法,所述混合音频信号包括多个音频对象。进一步公开了一种用于训练稀疏音频对象分离模型的计算机实施的方法以及一种用于从混合音频信号中分离稀疏音频对象的方法,所述混合音频信号至少包括稀疏音频对象、非稀疏音频对象以及至少一个另外的音频对象。进一步公开了一种用于基于信噪比SNR来处理音频的计算机实施的方法以及一种用于基于场景环境分类来处理音频的计算机实施的方法。公开了一种非暂态计算机可读介质以及一种被配置为执行所述方法中的一种或多种的系统。

Patent Agency Ranking