-
公开(公告)号:CN113591497A
公开(公告)日:2021-11-02
申请号:CN202110861033.5
申请日:2021-07-29
Applicant: 内蒙古工业大学
IPC: G06F40/58 , G06F40/30 , G06F40/284 , G10L15/00 , G10L15/26
Abstract: 本发明公开了一种基于词素媒介的蒙汉机器翻译方法,涉及蒙汉互译技术领域,包括信息输入:将需要进行翻译的信息输入至系统内,输入信息可以为文字形式或者语言形式;S2、词素提取:将输入到系统中的信息进行分解,并提取出信息中的词素信息;S3、词素组合:对分解的词素分为多种词素组合进行拼接,并将其转换为需要被翻译的语音进行组合,本发明的有益效果为:该基于词素媒介的蒙汉机器翻译方法,通过采用语言以及文字双重输入的方式,可以根据使用者的使用要求切换不同的使用方式,并且在进行翻译的时候是利用词素作为媒介进行翻译,可以在保证语句原意的情况下对语句进行分解,并且再将翻译为中文后进行组合,避免翻译出现语义不同的情况。
-
公开(公告)号:CN114822487B
公开(公告)日:2025-04-01
申请号:CN202210252979.6
申请日:2022-03-15
Applicant: 内蒙古工业大学
IPC: G10L13/02 , G10L13/08 , G06F18/214 , G06N3/0464 , G06N3/08 , G06N3/0455 , G10L25/30
Abstract: 本发明公开一种基于ghost和iLPCnet的蒙古语语音合成方法,基于Bang预训练模型,对齐蒙古语音素信息序列;基于ghost的声学模型,根据音素序列生成声学特征;以iLPCnet模型为声码器,进行声学特征到语音波形的转换。本发明使用Encoder‑Decoder模型将蒙古语文本转化成音素,其次使用基于ghost的声学模型将音素直接生成mel频谱,iLPCnet声码器直接将mel频谱转化为语音波形,可以无缝地集成到端到端的TTS系统降低了对参数的需求,提高了语音合成的速度,适合于小语种的语音合成。
-
公开(公告)号:CN114822487A
公开(公告)日:2022-07-29
申请号:CN202210252979.6
申请日:2022-03-15
Applicant: 内蒙古工业大学
Abstract: 本发明公开一种基于ghost和iLPCnet的蒙古语语音合成方法,基于Bang预训练模型,对齐蒙古语音素信息序列;基于ghost的声学模型,根据音素序列生成声学特征;以iLPCnet模型为声码器,进行声学特征到语音波形的转换。本发明使用Encoder‑Decoder模型将蒙古语文本转化成音素,其次使用基于ghost的声学模型将音素直接生成mel频谱,iLPCnet声码器直接将mel频谱转化为语音波形,可以无缝地集成到端到端的TTS系统降低了对参数的需求,提高了语音合成的速度,适合于小语种的语音合成。
-
公开(公告)号:CN113723084A
公开(公告)日:2021-11-30
申请号:CN202110842205.4
申请日:2021-07-26
Applicant: 内蒙古工业大学
IPC: G06F40/253 , G06F40/284 , G06F40/44 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 一种融合先验知识的蒙古语文本情感分析方法,对含有表情符的蒙古语情感文本语料库进行预处理;将经过预处理得到的文本词和表情符转换为动态词向量;分别创建蒙古语情感词典和表情符的情感词典将二者提取的特征作为模型最终提取的情感特征;由CNN网络和门控机制组成蒙古语文本情感分析模型;将融入先验知识的模型在大规模蒙古语语料上进行预训练,得到融合先验知识的蒙古语文本情感分析模型;将该模型的分析结果与单一网络分析方法的分析结果就精确率、召回率和F1值进行对比和评价,达到提高蒙古语文本情感分析性能的目的。
-
公开(公告)号:CN113609849A
公开(公告)日:2021-11-05
申请号:CN202110765525.4
申请日:2021-07-07
Applicant: 内蒙古工业大学
IPC: G06F40/284 , G06F40/30 , G06F40/242 , G06F40/58 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种融合先验知识模型的蒙古语多模态细粒度情感分析方法,对含有表情符的中文和蒙古语情感语料库进行预处理;分别将经过预处理得到的文本词和表情符转换为动态词向量;引入注意力机制对文本词量和表情符词向量拼接的词向量进行细粒度情感分析;并分别创建蒙古语情感词典和表情符的情感词典将二者提取的特征作为模型最终提取的情感特征;将融入先验知识的模型在大规模中文及蒙古语语料上进行预训练,得到融合先验知识模型的蒙古语多模态细粒度情感分析模型;将该模型的分析结果与单一网络分析方法的分析结果就每个情感类别的准确率、精确率、召回率和F1值进行对比和评价,达到提高蒙古语文本情感分析性能的目的。
-
公开(公告)号:CN113838449A
公开(公告)日:2021-12-24
申请号:CN202110817588.X
申请日:2021-07-20
Applicant: 内蒙古工业大学
Abstract: 本发明公开了一种新型蒙古语语音合成方法,具体包括以下步骤:S1、基于BiLSTM对蒙古文单词序列进行处理:基于BiLSTM神经网络提出了融合形态向量和音系向量的蒙古文韵律建模方法,包括输入层,注意力层,BiLSTM层和输出层,对输入的蒙古文单词序列进行处理,具体地,给定蒙古文单词的词向量WE、形态向量ME、音系向量PE,本发明涉及语音合成技术领域。该新型蒙古语语音合成方法,基于BiLSTM神经网络提出了融合形态向量和音系向量的蒙古文韵律建模,对输入的蒙古文单词序列进行处理,利用合成器,将文字输入生产声学特征,而后利用声码器从声学特征生成波形输出,其中,加入了对WaveGlow的改进,极大的在计算和消耗上提升了合成器的效率。
-
公开(公告)号:CN113850090A
公开(公告)日:2021-12-28
申请号:CN202111113235.8
申请日:2021-09-23
Applicant: 内蒙古工业大学
IPC: G06F40/58 , G06F40/242 , G06N3/04 , G06N3/08
Abstract: 一种融合双语词典的蒙汉神经机器翻译方法,通过在NMT系统中增加离散的翻译词典,意在解决NMT在翻译低频实词时经常出错的问题。首先构造词典概率,对于平行语料库中的词汇对,使用IBM模型通过无监督方式进行自动学习,对未被平行语料库覆盖的但收录于手制词典中的词汇对,定义翻译集并假设其为均匀分布;然后在编码阶段将词典概率转换为条件预测概率,然后将此预测概率与NMT模型的概率整合到一起,本发明使用两种整合方式:其一为;将其作为偏置、其二为;线性插值。
-
公开(公告)号:CN113469123A
公开(公告)日:2021-10-01
申请号:CN202110826492.X
申请日:2021-07-21
Applicant: 内蒙古工业大学
Abstract: 本发明公开了一种基于改进的VGG‑16模型的传统蒙古文字母识别方法,主要对传统的蒙古文手写体字母图像数据进行预处理,将蒙古文手写体字母图像数据进行归一化和灰度化的预处理操作;一个图片代表一个蒙古文手写体字母,在传统蒙古文中,字母分为词首、词中、词尾三个部分;其中每个字母都有相应的词首、词中、词尾写法;把预处理过的数据按一定比例分为训练集和测试集;利用预处理的传统蒙古文手写体字母图像数据训练得到基于改进的VGG‑16模型;将该模型的分析结果与原网络模型的分析结果就损失值、识别精确率和F1值进行对比和评价,达到提高传统蒙古文手写体字母识别的效果。
-
-
-
-
-
-
-
-