-
公开(公告)号:CN113377901B
公开(公告)日:2022-08-19
申请号:CN202110533016.9
申请日:2021-05-17
Applicant: 内蒙古工业大学
IPC: G06F16/33 , G06F16/36 , G06F40/284 , G06N3/04 , G06N3/08
Abstract: 一种基于多尺寸CNN和LSTM模型的蒙古语文本情感分析方法,对中文和蒙古语情感文本语料库进行预处理;将经过预处理得到的词转换为动态词向量;由多尺寸CNN网络和mLSTM网络并联组成蒙古语文本情感分析模型;将二者提取的特征拼接作为模型最终提取的情感特征;采用迁移学习策略将大规模中文情感文本语料作为训练集,并将训练得到的神经网络参数权重迁移至蒙古语文本情感分析模型中作为初始参数,利用预处理的蒙古语情感文本语料训练得到基于多尺寸CNN和LSTM模型的蒙古语文本情感分析模型;将该模型的分析结果与单一网络分析方法的分析结果就精确率、召回率和F1值进行对比和评价,达到提高蒙古语文本情感分析性能的目的。
-
公开(公告)号:CN113887249A
公开(公告)日:2022-01-04
申请号:CN202111113538.X
申请日:2021-09-23
Applicant: 内蒙古工业大学
IPC: G06F40/58 , G06F40/211 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于依存句法信息和Transformer模型的蒙汉神经机器翻译方法,包括:依据蒙汉平行语料库抽取出汉语依存句法信息,并将依存句法信息转换成邻接矩阵;在Transformer模型的输出端额外增加一路,则Transformer模型的一路用于预测汉语目标语句,另一路学习汉语依存句法知识;在编码器端显式地加入用于学习蒙语句法信息的模块,利用汉语句法知识强化蒙语语法的学习,原始Transformer模型默认隐式地学习了源语言、目标语言的句法信息,本发明显式地利用目标语言端的句法信息指导模型对源语言的句法信息进行学习。
-
公开(公告)号:CN113065432A
公开(公告)日:2021-07-02
申请号:CN202110306372.7
申请日:2021-03-23
Applicant: 内蒙古工业大学
Abstract: 一种基于数据增强和ECA‑Net的手写体蒙古文识别方法,利用弹性形变数据增强和/或随机擦除数据增强对现有的蒙古文手写体识别数据库进行数据增强,得到增强数据库;获取手写体蒙古文的图片作为输入图像,使用包含高效通道注意模块的残差网络对输入图像进行特征提取得到特征图;对特征图进行向量化,进而利用增强数据库识别手写体蒙古文。本发明利用弹性形变数据增强以及随机擦除数据增强,获得形式更加丰富的蒙古文手写体识别数据库,同时有助于提高模型对于遮挡的鲁棒性。通过使用高效通道注意模块,避免降维,同时有效捕获跨通道交互信息,最终识别系统训练使用ACE损失函数结合GRU,可以更快地推断和反向传播。
-
公开(公告)号:CN113377901A
公开(公告)日:2021-09-10
申请号:CN202110533016.9
申请日:2021-05-17
Applicant: 内蒙古工业大学
IPC: G06F16/33 , G06F16/36 , G06F40/284 , G06N3/04 , G06N3/08
Abstract: 一种基于多尺寸CNN和LSTM模型的蒙古语文本情感分析方法,对中文和蒙古语情感文本语料库进行预处理;将经过预处理得到的词转换为动态词向量;由多尺寸CNN网络和mLSTM网络并联组成蒙古语文本情感分析模型;将二者提取的特征拼接作为模型最终提取的情感特征;采用迁移学习策略将大规模中文情感文本语料作为训练集,并将训练得到的神经网络参数权重迁移至蒙古语文本情感分析模型中作为初始参数,利用预处理的蒙古语情感文本语料训练得到基于多尺寸CNN和LSTM模型的蒙古语文本情感分析模型;将该模型的分析结果与单一网络分析方法的分析结果就精确率、召回率和F1值进行对比和评价,达到提高蒙古语文本情感分析性能的目的。
-
公开(公告)号:CN113887249B
公开(公告)日:2024-07-12
申请号:CN202111113538.X
申请日:2021-09-23
Applicant: 内蒙古工业大学
IPC: G06F40/58 , G06F40/211 , G06N3/0455 , G06N3/0442 , G06N3/08
Abstract: 本发明公开了一种基于依存句法信息和Transformer模型的蒙汉神经机器翻译方法,包括:依据蒙汉平行语料库抽取出汉语依存句法信息,并将依存句法信息转换成邻接矩阵;在Transformer模型的输出端额外增加一路,则Transformer模型的一路用于预测汉语目标语句,另一路学习汉语依存句法知识;在编码器端显式地加入用于学习蒙古语句法信息的模块,利用汉语句法知识强化蒙古语语法的学习,原始Transformer模型默认隐式地学习了源语言、目标语言的句法信息,本发明显式地利用目标语言端的句法信息指导模型对源语言的句法信息进行学习。
-
公开(公告)号:CN113850090A
公开(公告)日:2021-12-28
申请号:CN202111113235.8
申请日:2021-09-23
Applicant: 内蒙古工业大学
IPC: G06F40/58 , G06F40/242 , G06N3/04 , G06N3/08
Abstract: 一种融合双语词典的蒙汉神经机器翻译方法,通过在NMT系统中增加离散的翻译词典,意在解决NMT在翻译低频实词时经常出错的问题。首先构造词典概率,对于平行语料库中的词汇对,使用IBM模型通过无监督方式进行自动学习,对未被平行语料库覆盖的但收录于手制词典中的词汇对,定义翻译集并假设其为均匀分布;然后在编码阶段将词典概率转换为条件预测概率,然后将此预测概率与NMT模型的概率整合到一起,本发明使用两种整合方式:其一为;将其作为偏置、其二为;线性插值。
-
公开(公告)号:CN113205792A
公开(公告)日:2021-08-03
申请号:CN202110378946.1
申请日:2021-04-08
Applicant: 内蒙古工业大学
IPC: G10L13/02 , G10L13/027 , G10L13/08 , G10L19/16
Abstract: 本发明一种基于Transformer和WaveNet的蒙古语语音合成方法,基于Encoder‑Decoder模型,对蒙古语进行G2P转换,将经过拉丁校正的蒙古语文本转换为对应的音素序列;基于Transformer的声学模型,根据音素序列生成声学特征;以WaveNet模型为声码器,进行声学特征到语音波形的转换。本发明使用Encoder‑Decoder模型将蒙古语文本转化成音素,可以无缝地集成到端到端的TTS系统,其次使用基于Transformer的声学模型将音素直接生成梅尔频谱,WaveNet声码器直接将梅尔频谱转化为语音波形,降低了对语料以及其它语言学知识的需求,适合于小语种的语音合成。
-
-
-
-
-
-