-
公开(公告)号:CN115050379B
公开(公告)日:2024-08-06
申请号:CN202210454133.0
申请日:2022-04-24
Applicant: 华侨大学
Abstract: 本发明提供一种基于FHGAN的高保真语音增强模型及其应用,高保真语音增强模型是将端到端的FFTNet模型与生成对抗网络结构相结合,添加PFPLoss引导生成器建模,利用HiFi‑GAN多尺度对抗判别器,并与SE‑FFTNet生成器匹配,在时域和频域上提取深度特征匹配损失,结合适用的目标函数在生成对抗网络机制下平衡学习,得到的FHGAN模型即为所述高保真语音增强模型。本发明在基线模型SE‑FFTNet、HiFi‑GAN的基础上提出FHGAN网络,能够可大大降低模型的计算复杂度、有效区分噪声和干净语音,还原增强语音信号感知细节,可确保语音信号信号完整性。
-
公开(公告)号:CN115050379A
公开(公告)日:2022-09-13
申请号:CN202210454133.0
申请日:2022-04-24
Applicant: 华侨大学
Abstract: 本发明提供一种基于FHGAN的高保真语音增强模型及其应用,高保真语音增强模型是将端到端的FFTNet模型与生成对抗网络结构相结合,添加PFPLoss引导生成器建模,利用HiFi‑GAN多尺度对抗判别器,并与SE‑FFTNet生成器匹配,在时域和频域上提取深度特征匹配损失,结合适用的目标函数在生成对抗网络机制下平衡学习,得到的FHGAN模型即为所述高保真语音增强模型。本发明在基线模型SE‑FFTNet、HiFi‑GAN的基础上提出FHGAN网络,能够可大大降低模型的计算复杂度、有效区分噪声和干净语音,还原增强语音信号感知细节,可确保语音信号信号完整性。
-