-
公开(公告)号:CN117373470A
公开(公告)日:2024-01-09
申请号:CN202311379975.5
申请日:2023-10-24
Applicant: 华南农业大学
Inventor: 潘奕岐
IPC: G10L21/0208 , G10L21/0224 , G10L21/0232 , G10L25/30 , G10L15/02 , G10L15/06 , G10L15/16 , G10L15/187
Abstract: 本发明公开了基于改进U‑net和目标特征感知对比度拉伸的语音增强算法,包括:步骤S1,通过将噪声与纯净语音进行合成得到带噪语音作为输入语音片段;步骤S2,对输入语音片段进行归一化处理,并通过PCS对归一化的输入语音片段进行语音增强,获得输入时频图特征;步骤S3,建立CResDi l‑U‑Net网络模型,输入时频图特征作为网络模型的输入,进行编码、解码操作,进而去除噪声,获得预测结果。降低了语音片段去噪时的细节失真,提高了语音提取的准确率。
-
公开(公告)号:CN117995213A
公开(公告)日:2024-05-07
申请号:CN202410140215.7
申请日:2024-01-31
Applicant: 华南农业大学
IPC: G10L21/0216 , G06V10/40 , G06V10/774 , G06V10/82 , G06N3/0455 , G10L25/30
Abstract: 本发明公开了基于改进CRN和CBAM注意力机制的实时语音增强方法,包括:步骤S1,获取语音数据集,并对获取的数据集进行预处理;步骤S2,将预处理好的语音信号的频谱图特征分为训练集、验证集以及测试集;步骤S3,构建基于改进CRN和CBAM的实时语音增强算法模型;步骤S4,使用训练集的数据对构建的基于改进CRN和CBAM的实时语音增强算法模型进行训练;步骤S5,使用验证集的数据对训练好的基于改进CRN和CBAM的实时语音增强算法模型进行验证;步骤S6,将测试集的数据输入到验证好的基于改进CRN和CBAM的实时语音增强算法模型,得到降噪后的语音结果。本发明有效增强干净语音特征。
-