Patent search ap:("杜比实验室特许公司") AND inv:"R·J·卡特怀特" Page 1

1.

发明公开
用于言语增强的数据扩充审中-实审

公开(公告)号：CN117643075A

公开(公告)日：2024-03-01

申请号：CN202280049982.6

申请日：2022-07-12

Applicant: 杜比实验室特许公司

Inventor： 戴佳 , 李凯 , 刘晓宇 , R·J·卡特怀特 , 杨少凡

IPC: H04S7/00

Abstract: 提供了一种用于对音频信号进行去混响的方法。在一些实施方式中，所述方法涉及：获得真实声脉冲响应(AIR)；识别所述真实AIR的与直达声的早期反射相对应的第一部分和所述真实AIR的与所述直达声的晚期反射相对应的第二部分；通过修改所述真实AIR的第一部分和/或所述真实AIR的第二部分来生成一个或多个合成AIR；以及使用所述真实AIR和所述一个或多个合成AIR来生成多个训练样本，每个训练样本包括输入音频信号和混响音频信号，其中，所述混响音频信号是基于所述输入音频信号以及所述真实AIR或所述一个或多个合成AIR之一中的至少一者来生成的，所述多个训练样本被用于训练机器学习模型。

2.

发明公开
言语增强审中-实审

公开(公告)号：CN117693791A

公开(公告)日：2024-03-12

申请号：CN202280050059.4

申请日：2022-07-12

Applicant: 杜比实验室特许公司

Inventor： 戴佳 , 李凯 , 刘晓宇 , R·J·卡特怀特

IPC: G10L21/0208 , G06N3/0464 , G10L21/0232

Abstract: 提供了一种用于增强音频信号的方法。在一些实施方式中，所述方法涉及(a)获得包括多个训练样本的训练集，每个训练样本包括失真音频信号和纯净音频信号。在一些实施方式中，所述方法涉及(b)对于所述多个训练样本中的训练样本：获得所述失真音频信号的频域表示；将所述频域表示提供给包括多个卷积层的卷积神经网络(CNN)和循环元件，其中，所述循环元件的输出被提供给所述多个卷积层的子集，生成预测增强掩码，其中，所述CNN生成所述预测增强掩码；基于所述预测增强掩码来生成预测的增强音频信号；以及基于所述预测的增强音频信号来更新与所述CNN和所述循环元件相关联的权重。

Patent Agency Ranking