基于ghost和iLPCnet的蒙古语语音合成方法

    公开(公告)号:CN114822487A

    公开(公告)日:2022-07-29

    申请号:CN202210252979.6

    申请日:2022-03-15

    Abstract: 本发明公开一种基于ghost和iLPCnet的蒙古语语音合成方法,基于Bang预训练模型,对齐蒙古语音素信息序列;基于ghost的声学模型,根据音素序列生成声学特征;以iLPCnet模型为声码器,进行声学特征到语音波形的转换。本发明使用Encoder‑Decoder模型将蒙古语文本转化成音素,其次使用基于ghost的声学模型将音素直接生成mel频谱,iLPCnet声码器直接将mel频谱转化为语音波形,可以无缝地集成到端到端的TTS系统降低了对参数的需求,提高了语音合成的速度,适合于小语种的语音合成。

    基于T-M BERT预训练模型的蒙古语多模态情感分析方法

    公开(公告)号:CN114153973A

    公开(公告)日:2022-03-08

    申请号:CN202111489025.9

    申请日:2021-12-07

    Abstract: 一种基于T‑M BERT预训练模型的蒙古语多模态情感分析方法,对含有文本、表情符和GIF短视频的中文情感语料进行神经机器翻译和人工校正处理,获得蒙古语情感语料;对蒙古语文本、表情符,使用T‑M BERT提取情感特征;针对蒙古语GIF短视频,使用G‑Transformer提取情感特征;引入注意力机制动态调整文本、表情符和GIF短视频权重信息,得到最终的情感特征。采用Softmax函数对情感特征进行分类,获得最终的蒙古语多模态情感分析模型,并得出情感分类结果。最后,将该模型的分析结果与单个网络的分析结果就每个情感类别的准确率、精确率、召回率和F1值进行对比和评价,达到提高分析和舆情预测性能的目的。

Patent Agency Ranking