基于改进U-net和目标特征感知对比度拉伸的语音增强算法

    公开(公告)号:CN117373470A

    公开(公告)日:2024-01-09

    申请号:CN202311379975.5

    申请日:2023-10-24

    Inventor: 潘奕岐

    Abstract: 本发明公开了基于改进U‑net和目标特征感知对比度拉伸的语音增强算法,包括:步骤S1,通过将噪声与纯净语音进行合成得到带噪语音作为输入语音片段;步骤S2,对输入语音片段进行归一化处理,并通过PCS对归一化的输入语音片段进行语音增强,获得输入时频图特征;步骤S3,建立CResDi l‑U‑Net网络模型,输入时频图特征作为网络模型的输入,进行编码、解码操作,进而去除噪声,获得预测结果。降低了语音片段去噪时的细节失真,提高了语音提取的准确率。

    基于改进CRN和CBAM注意力机制的实时语音增强方法

    公开(公告)号:CN117995213A

    公开(公告)日:2024-05-07

    申请号:CN202410140215.7

    申请日:2024-01-31

    Inventor: 张宇 潘奕岐

    Abstract: 本发明公开了基于改进CRN和CBAM注意力机制的实时语音增强方法,包括:步骤S1,获取语音数据集,并对获取的数据集进行预处理;步骤S2,将预处理好的语音信号的频谱图特征分为训练集、验证集以及测试集;步骤S3,构建基于改进CRN和CBAM的实时语音增强算法模型;步骤S4,使用训练集的数据对构建的基于改进CRN和CBAM的实时语音增强算法模型进行训练;步骤S5,使用验证集的数据对训练好的基于改进CRN和CBAM的实时语音增强算法模型进行验证;步骤S6,将测试集的数据输入到验证好的基于改进CRN和CBAM的实时语音增强算法模型,得到降噪后的语音结果。本发明有效增强干净语音特征。

Patent Agency Ranking