Patent search ap:("之江实验室") AND inv:"张镇川" Page 1

1.

发明授权
一种利用多源辅助信息的通用语音增强方法和装置有权

公开(公告)号：CN114999508B

公开(公告)日：2022-11-08

申请号：CN202210902896.7

申请日：2022-07-29

Applicant: 之江实验室

Inventor： 李劲松 , 张镇川 , 周天舒 , 田雨

IPC: G10L21/02 , G10L21/0208 , G10L25/30

Abstract: 本发明公开了一种利用多源辅助信息的通用语音增强方法和装置，包括以下步骤：步骤S1：构建训练数据集；步骤S2：利用所述训练数据集对模型的网络参数进行学习，构建语音增强模型；步骤S3：通过预采集或者现场采集的方式构建声源信息数据库；步骤S4：获取语音增强模型的输入；步骤S5：将所述含噪原始信号作为所述语音增强模型的主输入，所述目标组辅助声源信号和所述干扰组辅助声源信号作为所述语音增强模型的旁输入进行语音增强，得到增强语音信号。本发明多类声源辅助声源信息提取辅助声源信号表征；对待增强的原始音频信息提取原始信号表征；将原始信号表征与辅助声源信号表征送入语音增强模型进行语音增强。

2.

发明公开
一种利用多源辅助信息的通用语音增强方法和装置有权

公开(公告)号：CN114999508A

公开(公告)日：2022-09-02

申请号：CN202210902896.7

申请日：2022-07-29

Applicant: 之江实验室

Inventor： 李劲松 , 张镇川 , 周天舒 , 田雨

IPC: G10L21/02 , G10L21/0208 , G10L25/30

Abstract: 本发明公开了一种利用多源辅助信息的通用语音增强方法和装置，包括以下步骤：步骤S1：构建训练数据集；步骤S2：利用所述训练数据集对模型的网络参数进行学习，构建语音增强模型；步骤S3：通过预采集或者现场采集的方式构建声源信息数据库；步骤S4：获取语音增强模型的输入；步骤S5：将所述含噪原始信号作为所述语音增强模型的主输入，所述目标组辅助声源信号和所述干扰组辅助声源信号作为所述语音增强模型的旁输入进行语音增强，得到增强语音信号。本发明多类声源辅助声源信息提取辅助声源信号表征；对待增强的原始音频信息提取原始信号表征；将原始信号表征与辅助声源信号表征送入语音增强模型进行语音增强。

Patent Agency Ranking