一种歌仔戏唱腔合成方法
    1.
    发明公开

    公开(公告)号:CN119207368A

    公开(公告)日:2024-12-27

    申请号:CN202411394925.9

    申请日:2024-10-08

    Applicant: 厦门大学

    Inventor: 田雨奇 史晓东

    Abstract: 本发明公开了一种歌仔戏唱腔合成方法,涉及歌仔戏唱腔合成领域,解决了现有歌仔戏合成中,缺乏标注数据,导致数据匮乏,且语音合成模型及歌声合成模型对数据的局部特征建模不充分的问题,现提出如下方案,其包括利用神经音频编解码器EnCodec的强大能力从EnCodec的码本中采样出与编码器输出特征相似的隐表征,并重建为音频,我们成功地扩展了歌仔戏数据集,为模型训练提供了更多的数据支持;提出歌仔戏合成模型FG‑GAN,通过提出GConformer模块,在Conformer架构的基础上提出分组深度可分离卷积模块,扩大了模型对谱图的感受野,从而增强了模型对局部特征的捕捉能力。此外,FG‑GAN还提出了一种基于流模型的帧级别隐表征建模模块,以更好地拟合同一音素或音高内音频的变化。

Patent Agency Ranking