用于风噪声抑制的方法和音频处理系统

    公开(公告)号:CN118922884A

    公开(公告)日:2024-11-08

    申请号:CN202380026675.0

    申请日:2023-03-08

    Abstract: 本公开涉及一种用于抑制风噪声的方法和系统(1)。该方法包括获取包括多个连续音频信号分段(101、102、103、101'、102'、103')的输入音频信号(100、101'),并且用风噪声抑制器模块(20)抑制输入音频信号中的风噪声以产生风噪声降低的音频信号。该方法还包括使用经训练以预测增益集的神经网络(10),用于降低输入音频信号(100、100')的输入音频信号(100、100')给定样本中的噪声,其中通过将所述增益集施加给输入音频信号(100、101')来形成降噪音频信号,并用混频器(30)混合风噪声降低的音频信号和降噪音频信号,以获取具有经抑制风噪声的输出音频信号。

    基于媒体类型的去混响
    12.
    发明公开

    公开(公告)号:CN116964666A

    公开(公告)日:2023-10-27

    申请号:CN202280019905.6

    申请日:2022-03-10

    Abstract: 用于抑制混响的方法可以涉及接收输入音频信号。该方法可以涉及将输入音频信号的媒体类型分类为至少包括以下各项的组中的一项:1)言语;2)音乐;或者3)音乐下的言语。该方法可以涉及至少基于确定输入音频信号的媒体类型已被分类为言语来确定是否要对输入音频信号执行去混响。该方法可以涉及响应于确定要对输入音频信号执行去混响,通过对输入音频信号执行去混响来生成输出音频信号。

    音频对象分离和处理音频
    14.
    发明公开

    公开(公告)号:CN119790458A

    公开(公告)日:2025-04-08

    申请号:CN202380060928.6

    申请日:2023-08-18

    Abstract: 公开了一种用于分离混合音频信号中的音频对象的方法,所述混合音频信号包括多个音频对象。进一步公开了一种用于训练稀疏音频对象分离模型的计算机实施的方法以及一种用于从混合音频信号中分离稀疏音频对象的方法,所述混合音频信号至少包括稀疏音频对象、非稀疏音频对象以及至少一个另外的音频对象。进一步公开了一种用于基于信噪比SNR来处理音频的计算机实施的方法以及一种用于基于场景环境分类来处理音频的计算机实施的方法。公开了一种非暂态计算机可读介质以及一种被配置为执行所述方法中的一种或多种的系统。

    高度对象的分离和渲染
    15.
    发明公开

    公开(公告)号:CN119422389A

    公开(公告)日:2025-02-11

    申请号:CN202380049436.7

    申请日:2023-06-23

    Abstract: 本公开涉及一种用于处理音频的方法和系统,以及一种包括指令的计算机程序产品,当所述程序由计算机执行时,所述指令使所述计算机执行所述方法。所述方法包括获得输入音频信号并处理所述输入音频信号以从所述输入音频信号中提取高度音频对象,其中,所述高度音频对象是使用被配置为提取预定高度音频源类型的音频对象的源分离模块来提取的。所述方法进一步包括将所述输入音频信号渲染到多声道呈现,使得所述至少一个高度音频对象被包括在所述多声道呈现的至少一个高度声道中。

    情境感知音频捕捉和渲染
    16.
    发明公开

    公开(公告)号:CN118923135A

    公开(公告)日:2024-11-08

    申请号:CN202380029774.4

    申请日:2023-03-17

    Abstract: 公开了用于情境感知捕捉和渲染的实施例。在一个实施例中,音频处理方法包括:捕捉多通道输入音频信号;对于多通道输入音频信号的每个通道,生成降噪的感兴趣目标声音事件以及环境噪声;确定用于渲染的事件类型;基于事件类型和扬声器布局选择渲染方案;以及使用所选的渲染方案来渲染多通道输出音频信号。

    移动捕获的音频增强
    17.
    发明公开

    公开(公告)号:CN117917094A

    公开(公告)日:2024-04-19

    申请号:CN202280061137.0

    申请日:2022-09-07

    Abstract: 公开了一种用于实时监控用户生成的音频内容以发现音频异常的系统和相关方法。在一些实施例中,所述系统被编程为实时地接收由第一移动设备(比如智能手机)生成的音频数据。所述系统被编程为根据音频数据实时地确定是否发生音频异常。所述系统被编程为响应于检测到音频异常的发生而实时地向第二移动设备(其可以是同一部智能手机)呈现警报。

    情境感知声景控制
    18.
    发明公开

    公开(公告)号:CN117044233A

    公开(公告)日:2023-11-10

    申请号:CN202280021289.8

    申请日:2022-04-28

    Abstract: 公开了情境感知声景控制的实施例。在实施例中,一种音频处理方法包括:使用移动设备上的第一组麦克风捕获来自音频场景的第一音频信号;使用一副耳塞上的第二组麦克风捕获来自所述音频场景的第二音频信号;使用所述移动设备上的相机捕获来自视频场景的视频信号;利用至少一个处理器从所述第一音频信号和所述第二音频信号生成经处理的音频信号,所述经处理的音频信号是基于情境信息通过自适应声景控制来生成的;以及利用所述至少一个处理器将所述经处理的音频信号与所捕获的视频信号进行组合以作为多媒体输出。

    用于双耳音频录制的感知增强
    19.
    发明公开

    公开(公告)号:CN116636233A

    公开(公告)日:2023-08-22

    申请号:CN202180086839.X

    申请日:2021-12-14

    Abstract: 一种音频处理的方法包括捕获双耳音频信号,使用机器学习模型计算噪声减少增益,以及生成经修改的双耳音频信号。该方法还可以包括对音频执行各种校正以考虑由诸如前置相机和后置相机的不同相机捕获的视频。该方法还可以包括在前置相机与后置相机之间切换时执行双耳音频的平滑切换。以这种方式,在双耳音频中可以减少噪声,并且可以提高组合的视频和双耳音频的用户感知。

    动态地调整压缩器的阈值的方法和设备

    公开(公告)号:CN112640301B

    公开(公告)日:2022-03-29

    申请号:CN201980057612.5

    申请日:2019-09-26

    Inventor: 马远星

    Abstract: 本申请案涉及响应于输入音频信号而动态地调整压缩器的阈值的方法、系统及计算机程序产品。场景切换分析器接收具有多个频带分量的输入音频信号。所述场景切换分析器确定所述输入音频信号中是否已发生场景切换。处理所述输入音频信号的所述频带分量。响应于确定尚未发生场景切换,失真可听度系统将缓慢平滑应用到所述频带分量的压缩器阈值。响应于确定已发生场景切换,所述失真可听度系统将快速平滑应用到所述频带分量的所述压缩器阈值或不将平滑应用到所述频带分量的所述压缩器阈值。

Patent Agency Ranking