一种基于FHGAN的高保真语音增强模型及其应用

    公开(公告)号:CN115050379B

    公开(公告)日:2024-08-06

    申请号:CN202210454133.0

    申请日:2022-04-24

    Applicant: 华侨大学

    Abstract: 本发明提供一种基于FHGAN的高保真语音增强模型及其应用,高保真语音增强模型是将端到端的FFTNet模型与生成对抗网络结构相结合,添加PFPLoss引导生成器建模,利用HiFi‑GAN多尺度对抗判别器,并与SE‑FFTNet生成器匹配,在时域和频域上提取深度特征匹配损失,结合适用的目标函数在生成对抗网络机制下平衡学习,得到的FHGAN模型即为所述高保真语音增强模型。本发明在基线模型SE‑FFTNet、HiFi‑GAN的基础上提出FHGAN网络,能够可大大降低模型的计算复杂度、有效区分噪声和干净语音,还原增强语音信号感知细节,可确保语音信号信号完整性。

    一种基于FHGAN的高保真语音增强模型及其应用

    公开(公告)号:CN115050379A

    公开(公告)日:2022-09-13

    申请号:CN202210454133.0

    申请日:2022-04-24

    Applicant: 华侨大学

    Abstract: 本发明提供一种基于FHGAN的高保真语音增强模型及其应用,高保真语音增强模型是将端到端的FFTNet模型与生成对抗网络结构相结合,添加PFPLoss引导生成器建模,利用HiFi‑GAN多尺度对抗判别器,并与SE‑FFTNet生成器匹配,在时域和频域上提取深度特征匹配损失,结合适用的目标函数在生成对抗网络机制下平衡学习,得到的FHGAN模型即为所述高保真语音增强模型。本发明在基线模型SE‑FFTNet、HiFi‑GAN的基础上提出FHGAN网络,能够可大大降低模型的计算复杂度、有效区分噪声和干净语音,还原增强语音信号感知细节,可确保语音信号信号完整性。

    一种自动初始化Snake模型的X光胸片肺野分割方法

    公开(公告)号:CN113706563A

    公开(公告)日:2021-11-26

    申请号:CN202111026188.3

    申请日:2021-09-02

    Applicant: 华侨大学

    Abstract: 本发明公开了一种自动初始化Snake模型的X光胸片肺野分割方法,包括:步骤A、图像预处理:将图像进行分割前预处理,得到边缘增强的图像;步骤B、Snake模型轮廓自动初始化:对预处理后的图像进行分析处理,实现Snake模型轮廓的自动初始化;步骤C、X光胸片肺野分割:运用Snake模型算法进行X光胸片肺野分割,得到肺野分割的结果。本发明提供的一种自动初始化Snake模型的X光胸片肺野分割方法,成功地将人力从繁琐的劳动中解放出来,提高了X光胸片肺野的分割效率,并且由于自动初始化的结果更加合理,也大大地提高了X光胸片肺野的分割精度。通过实现轮廓的自动初始化,提高了轮廓初始化过程的稳定性和鲁棒性,增加了Snake模型的自动化程度。

Patent Agency Ranking