-
公开(公告)号:CN117643075A
公开(公告)日:2024-03-01
申请号:CN202280049982.6
申请日:2022-07-12
Applicant: 杜比实验室特许公司
IPC: H04S7/00
Abstract: 提供了一种用于对音频信号进行去混响的方法。在一些实施方式中,所述方法涉及:获得真实声脉冲响应(AIR);识别所述真实AIR的与直达声的早期反射相对应的第一部分和所述真实AIR的与所述直达声的晚期反射相对应的第二部分;通过修改所述真实AIR的第一部分和/或所述真实AIR的第二部分来生成一个或多个合成AIR;以及使用所述真实AIR和所述一个或多个合成AIR来生成多个训练样本,每个训练样本包括输入音频信号和混响音频信号,其中,所述混响音频信号是基于所述输入音频信号以及所述真实AIR或所述一个或多个合成AIR之一中的至少一者来生成的,所述多个训练样本被用于训练机器学习模型。
-
公开(公告)号:CN117693791A
公开(公告)日:2024-03-12
申请号:CN202280050059.4
申请日:2022-07-12
Applicant: 杜比实验室特许公司
IPC: G10L21/0208 , G06N3/0464 , G10L21/0232
Abstract: 提供了一种用于增强音频信号的方法。在一些实施方式中,所述方法涉及(a)获得包括多个训练样本的训练集,每个训练样本包括失真音频信号和纯净音频信号。在一些实施方式中,所述方法涉及(b)对于所述多个训练样本中的训练样本:获得所述失真音频信号的频域表示;将所述频域表示提供给包括多个卷积层的卷积神经网络(CNN)和循环元件,其中,所述循环元件的输出被提供给所述多个卷积层的子集,生成预测增强掩码,其中,所述CNN生成所述预测增强掩码;基于所述预测增强掩码来生成预测的增强音频信号;以及基于所述预测的增强音频信号来更新与所述CNN和所述循环元件相关联的权重。
-