-
公开(公告)号:CN108986838A
公开(公告)日:2018-12-11
申请号:CN201811086181.9
申请日:2018-09-18
Applicant: 东北大学
IPC: G10L21/0216 , G10L21/0272 , G10L21/0308
Abstract: 本发明提供一种基于声源定位的自适应语音分离方法,涉及信息处理技术领域。包括:采集被观测环境音频信号,确认声音源个数和每个声音源的波达方向;生成降维矩阵P;生成语音传递矩阵和延迟叠加波束系数;判定频率点处的活跃声源并分离语音成分;获取得到的语音成分并将未激活声源成分置零;得到各个声源的时域语音信号。本方法通过声源定位技术获得当前环境下的声源数目与方位,配合PCA白化技术对语音信号的各个频段进行降维获得初始分离矩阵,通过频率点激活声源数目自适应的使用波束形成技术与FDICA技术分离各个声源通道的频率成分还原各个语音成分,获得的信噪比提升特性更高,具有更好的噪声抑制性能,适用于真实语音环境下的任意声源情形。
-
公开(公告)号:CN108986838B
公开(公告)日:2023-01-20
申请号:CN201811086181.9
申请日:2018-09-18
Applicant: 东北大学
IPC: G10L21/0216 , G10L21/0272 , G10L21/0308
Abstract: 本发明提供一种基于声源定位的自适应语音分离方法,涉及信息处理技术领域。包括:采集被观测环境音频信号,确认声音源个数和每个声音源的波达方向;生成降维矩阵P;生成语音传递矩阵和延迟叠加波束系数;判定频率点处的活跃声源并分离语音成分;获取得到的语音成分并将未激活声源成分置零;得到各个声源的时域语音信号。本方法通过声源定位技术获得当前环境下的声源数目与方位,配合PCA白化技术对语音信号的各个频段进行降维获得初始分离矩阵,通过频率点激活声源数目自适应的使用波束形成技术与FDICA技术分离各个声源通道的频率成分还原各个语音成分,获得的信噪比提升特性更高,具有更好的噪声抑制性能,适用于真实语音环境下的任意声源情形。
-
公开(公告)号:CN114360567A
公开(公告)日:2022-04-15
申请号:CN202210142181.6
申请日:2022-02-16
Applicant: 东北大学
IPC: G10L21/0208 , G10L21/0232 , G10L21/0264 , G10L25/30
Abstract: 本发明公开一种基于深度复卷积网络的单通道语音增强方法,方法首先构造带噪语音,计算带噪语音复数域上的频谱特征,并通过纯净语音时域序列数据计算掩膜特征CRM作为相应带噪语音的标签,构造训练集;然后构建深层复卷积网络模型,并通过计算估计语音在纯净语音上的投影值和估计噪音在噪声信号上的投影值,构造加权源失真比损失函数;接着将训练集中的带噪语音复数域上的频谱特征作为深层复卷积网络模型的输入数据对模型进行训练;最后利用训练好的深度复卷积网络模型对带噪语音信号进行降噪处理。本发明通过深度复卷积网络训练低信噪比场景下单麦克风语音信号的复掩膜特征,增加估计语音的信噪比,提升单通道语音增强方法的语音质量和可懂度。
-
-