-
公开(公告)号:CN113469123A
公开(公告)日:2021-10-01
申请号:CN202110826492.X
申请日:2021-07-21
Applicant: 内蒙古工业大学
Abstract: 本发明公开了一种基于改进的VGG‑16模型的传统蒙古文字母识别方法,主要对传统的蒙古文手写体字母图像数据进行预处理,将蒙古文手写体字母图像数据进行归一化和灰度化的预处理操作;一个图片代表一个蒙古文手写体字母,在传统蒙古文中,字母分为词首、词中、词尾三个部分;其中每个字母都有相应的词首、词中、词尾写法;把预处理过的数据按一定比例分为训练集和测试集;利用预处理的传统蒙古文手写体字母图像数据训练得到基于改进的VGG‑16模型;将该模型的分析结果与原网络模型的分析结果就损失值、识别精确率和F1值进行对比和评价,达到提高传统蒙古文手写体字母识别的效果。
-
公开(公告)号:CN113838449A
公开(公告)日:2021-12-24
申请号:CN202110817588.X
申请日:2021-07-20
Applicant: 内蒙古工业大学
Abstract: 本发明公开了一种新型蒙古语语音合成方法,具体包括以下步骤:S1、基于BiLSTM对蒙古文单词序列进行处理:基于BiLSTM神经网络提出了融合形态向量和音系向量的蒙古文韵律建模方法,包括输入层,注意力层,BiLSTM层和输出层,对输入的蒙古文单词序列进行处理,具体地,给定蒙古文单词的词向量WE、形态向量ME、音系向量PE,本发明涉及语音合成技术领域。该新型蒙古语语音合成方法,基于BiLSTM神经网络提出了融合形态向量和音系向量的蒙古文韵律建模,对输入的蒙古文单词序列进行处理,利用合成器,将文字输入生产声学特征,而后利用声码器从声学特征生成波形输出,其中,加入了对WaveGlow的改进,极大的在计算和消耗上提升了合成器的效率。
-
公开(公告)号:CN114822487B
公开(公告)日:2025-04-01
申请号:CN202210252979.6
申请日:2022-03-15
Applicant: 内蒙古工业大学
IPC: G10L13/02 , G10L13/08 , G06F18/214 , G06N3/0464 , G06N3/08 , G06N3/0455 , G10L25/30
Abstract: 本发明公开一种基于ghost和iLPCnet的蒙古语语音合成方法,基于Bang预训练模型,对齐蒙古语音素信息序列;基于ghost的声学模型,根据音素序列生成声学特征;以iLPCnet模型为声码器,进行声学特征到语音波形的转换。本发明使用Encoder‑Decoder模型将蒙古语文本转化成音素,其次使用基于ghost的声学模型将音素直接生成mel频谱,iLPCnet声码器直接将mel频谱转化为语音波形,可以无缝地集成到端到端的TTS系统降低了对参数的需求,提高了语音合成的速度,适合于小语种的语音合成。
-
公开(公告)号:CN114822487A
公开(公告)日:2022-07-29
申请号:CN202210252979.6
申请日:2022-03-15
Applicant: 内蒙古工业大学
Abstract: 本发明公开一种基于ghost和iLPCnet的蒙古语语音合成方法,基于Bang预训练模型,对齐蒙古语音素信息序列;基于ghost的声学模型,根据音素序列生成声学特征;以iLPCnet模型为声码器,进行声学特征到语音波形的转换。本发明使用Encoder‑Decoder模型将蒙古语文本转化成音素,其次使用基于ghost的声学模型将音素直接生成mel频谱,iLPCnet声码器直接将mel频谱转化为语音波形,可以无缝地集成到端到端的TTS系统降低了对参数的需求,提高了语音合成的速度,适合于小语种的语音合成。
-
公开(公告)号:CN114153973A
公开(公告)日:2022-03-08
申请号:CN202111489025.9
申请日:2021-12-07
Applicant: 内蒙古工业大学
Abstract: 一种基于T‑M BERT预训练模型的蒙古语多模态情感分析方法,对含有文本、表情符和GIF短视频的中文情感语料进行神经机器翻译和人工校正处理,获得蒙古语情感语料;对蒙古语文本、表情符,使用T‑M BERT提取情感特征;针对蒙古语GIF短视频,使用G‑Transformer提取情感特征;引入注意力机制动态调整文本、表情符和GIF短视频权重信息,得到最终的情感特征。采用Softmax函数对情感特征进行分类,获得最终的蒙古语多模态情感分析模型,并得出情感分类结果。最后,将该模型的分析结果与单个网络的分析结果就每个情感类别的准确率、精确率、召回率和F1值进行对比和评价,达到提高分析和舆情预测性能的目的。
-
公开(公告)号:CN113850089A
公开(公告)日:2021-12-28
申请号:CN202111112986.8
申请日:2021-09-23
Applicant: 内蒙古工业大学
Abstract: 本发明公开了一种基于融合统计机器翻译模型的蒙汉神经机器翻译方法,具体包括以下步骤:S1、NMT分类器继承标准的基于注意力的NMT后在规则词表上估计单词的预测概率;S2、SMT分类器计算由辅助SMT模型生成的SMT建议的概率;S3、将SMT建议整合到NMT中;本发明涉及神经机器翻译技术领域。该基于融合统计机器翻译模型的蒙汉神经机器翻译方法,通过将统计机器翻译模型合并到神经机器翻译框架中,以利用统计机器翻译和神经机器翻译模型的优点来实现更好的翻译,SMT分类器和门控函数在NMT结构中以端到端方式联合训练,此外,为了更好地缓解测试阶段的UNK问题,通过联合考虑NMT模型的注意概率和SMT模型的覆盖率信息,选择合适的SMT建议来代替目标UNK单词。
-
公开(公告)号:CN113723084A
公开(公告)日:2021-11-30
申请号:CN202110842205.4
申请日:2021-07-26
Applicant: 内蒙古工业大学
IPC: G06F40/253 , G06F40/284 , G06F40/44 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 一种融合先验知识的蒙古语文本情感分析方法,对含有表情符的蒙古语情感文本语料库进行预处理;将经过预处理得到的文本词和表情符转换为动态词向量;分别创建蒙古语情感词典和表情符的情感词典将二者提取的特征作为模型最终提取的情感特征;由CNN网络和门控机制组成蒙古语文本情感分析模型;将融入先验知识的模型在大规模蒙古语语料上进行预训练,得到融合先验知识的蒙古语文本情感分析模型;将该模型的分析结果与单一网络分析方法的分析结果就精确率、召回率和F1值进行对比和评价,达到提高蒙古语文本情感分析性能的目的。
-
-
-
-
-
-