-
公开(公告)号:CN118364427A
公开(公告)日:2024-07-19
申请号:CN202410609845.4
申请日:2024-05-16
Applicant: 内蒙古工业大学
IPC: G06F18/25 , G06F40/253 , G06F40/242 , G06F18/214 , G06F18/213 , G06V20/40 , G06V10/82 , G06N3/045 , G06N3/0464 , G06N3/048 , G10L25/03
Abstract: 一种基于跨模态transformer的蒙古语多模态情感分析方法,获取蒙古语多模态情感数据集,包含人像和语音的视频片段以及对应的蒙古语文本;从数据集中获取文本、图像及音频模态数据,提取三种模态的特征表示;构建基于跨模态transformer的多模态特征融合模型,将文本、图像、音频三种模态的特征嵌入输入以文本为中心的特征融合模块,以文本模态分别引导图像模态和音频模态,得到联合特征;计算注意力矩阵,动态调整每种模态各个特征维度的权重,得到多模态特征的融合表示,将其输入预测模块得到最终的分类结果。本发明能够在融合过程中对齐多种模态并维护模态特定信息,提高蒙古语情感分析的泛化性能。
-
公开(公告)号:CN113657122B
公开(公告)日:2023-12-15
申请号:CN202111044287.4
申请日:2021-09-07
Applicant: 内蒙古工业大学
IPC: G06F40/42 , G06F40/44 , G06F40/58 , G06N3/096 , G06F40/289
Abstract: 一种融合迁移学习的伪平行语料库的蒙汉机器翻译方法,通过大规模的英汉平行语料库训练一个英汉神经机器翻译模型;对蒙古语进行预处理后构建蒙汉神经机器翻译模型;将训练好的英汉神经机器翻译模型的模型参数权重迁移到蒙汉神经机器翻译模型中;将现有的蒙汉平行语料库对蒙汉神经机器翻译模型进行完善训练,用完善好的蒙汉神经机器翻译模型对现有的蒙汉平行语料库中的汉语单语语料进行回译、加噪,形成一个伪平行语料库D1;将伪平行语料库D1和现有的蒙汉平行语料库融合形成伪平行语料库D;用伪平行语料库D重新训练完善好的蒙汉神经机器翻译模型,得到最终的蒙汉神经机器翻译模(56)对比文件吴一琦.融合句法分析的无监督神经机器翻译《.中国优秀硕士学位论文全文数据库哲学与人文科学辑》.2020,(第06期),F084-32.Wang Yijun 等.Dual transfer learningfor neural machine translation withmarginal distribution regularization.《Proceedings of the AAAI Conference onArtificial Intelligence》.2018,第32卷(第1期),5553-5560.范婷婷.基于微调的无监督域适应蒙汉神经机器翻译的研究《.中国优秀硕士学位论文全文数据库 信息科技辑》.2022,(第01期),I138-3777.
-
公开(公告)号:CN117079637A
公开(公告)日:2023-11-17
申请号:CN202310729047.0
申请日:2023-06-19
Applicant: 内蒙古工业大学
IPC: G10L13/027 , G10L13/08 , G10L25/18 , G10L25/30 , G10L25/63
Abstract: 一种基于条件生成对抗网络的蒙古语情感语音合成方法,对蒙古语文本进行字母到音素转换,得到音素序列数据;从蒙古语情感音频提取梅尔频谱一;将音素序列数据与梅尔频谱一输入语音文本联合预训练模型,训练语音和文本的对齐信息;FastSpeech2声学模型中加入情感模块,得到改进模型,以改进模型为生成器,引入鉴别器和情感标签构建条件生成式对抗网络;生成器以语音文本联合预训练模型的输出为输入,输出梅尔频谱二,鉴别器判断梅尔频谱二与梅尔频谱一,直至误差小于预设;将满足误差要求的梅尔频谱二输入至声码器,将声学特征转换为语音波形,完成蒙古语情感语音合成。本发明可以直接从字符合成情感语音,大大降低对语言学知识的要求。
-
公开(公告)号:CN116720530A
公开(公告)日:2023-09-08
申请号:CN202310727266.5
申请日:2023-06-19
Applicant: 内蒙古工业大学
IPC: G06F40/58 , G06N3/094 , G06N3/0455 , G06N3/048 , G06N5/02
Abstract: 一种基于预训练模型和对抗训练的蒙汉神经机器翻译方法,利用BERT预训练模型从蒙汉平行语料库获得知识表示;利用渐近蒸馏和动态切换,将含有知识表示的BERT预训练模型与NMT模型相结合;将蒙汉平行语料库中的蒙语语料和汉语语料分别转换为词向量,并进行词嵌入,得到蒙语词嵌入矩阵和汉语词嵌入矩阵;利用相对位置编码,在蒙语词嵌入矩阵和汉语词嵌入矩阵中的每个词位置分别添加一个位置确定的编码向量,得到蒙语向量矩阵和汉语向量矩阵;将蒙语向量矩阵和汉语向量矩阵输入并训练NMT模型。本发明通过渐进蒸馏以及动态开关门,避免预训练知识的灾难性遗忘,并且在多头注意编码机制中加入对抗训练,加强词向量的训练,减少误译现象。
-
公开(公告)号:CN116187311A
公开(公告)日:2023-05-30
申请号:CN202211152903.2
申请日:2022-09-21
Applicant: 内蒙古工业大学
IPC: G06F40/284 , G06F40/30 , G06N3/0464
Abstract: 一种融入先验知识的蒙古语词嵌入方法,将蒙古语文本中的单词不重复地放入一个空词表中得到词表vocab;用one‑hot对vocab中的单词编码;将蒙古语文本所有单词的one‑hot向量传入神经网络的隐藏层1,将各单词的one‑hot向量依次与隐藏层1的中心词权重矩阵相乘,得到的各中心词向量依次与隐藏层2的预测词权重矩阵相乘,得到每一个单词的预测词向量,再进行softmax运算输出新的预测词向量,引入先验知识对相关单词的余弦相似度进行验证,若不满足则返回动态调整隐藏层参数。本发明通过融入先验知识验证,辅之动态调节相应参数,以期提高向量表示文本嵌入的准确度,在高维空间中找到一个较好的嵌入结果。
-
公开(公告)号:CN113657125B
公开(公告)日:2023-05-26
申请号:CN202110793011.X
申请日:2021-07-14
Applicant: 内蒙古工业大学
IPC: G06F40/58 , G06F40/44 , G06F16/36 , G06F40/242 , G06F40/289 , G06N5/02
Abstract: 一种基于知识图谱的蒙汉非自回归机器翻译方法,通过知识图谱三元组构建蒙汉双语命名实体语义网,并基于多特征对齐构建命名实体词典;然后借助知识图谱三元组表示蒙古语稀有词组成分布并进行稀有词切分,过程中进行交互式增强生成对抗训练,并添加交互信息指导生成对抗,得到全面的稀有词知识图谱三元组集;对经过处理之后的蒙汉平行语料库进行知识蒸馏,在教师模型通过知识蒸馏为学生模型提取语料时,构建蒙汉平行语料库的知识图谱;在进行非自回归机器翻译时,利用知识图谱作为投影矩阵训练集,经过双向嵌入映射共同训练得到投影矩阵,并进行解码信息润色。本发明可在保证翻译速率提高的前提下,提高机器翻译的译文质量。
-
公开(公告)号:CN115618855A
公开(公告)日:2023-01-17
申请号:CN202210906050.0
申请日:2022-07-29
Applicant: 内蒙古工业大学
IPC: G06F40/268 , G06F40/216 , G06F40/289 , G06F16/951 , G06F16/35
Abstract: 一种基于句子分割算法和改进主题模型的蒙古语情感方面抽取方法,爬取互联网上的蒙古语商品评论消息,校正,清洗,去除停用词,修正错别字,标注词语词性,得到新的蒙古语文本文档s;对s进行情感极性检测,输出只保留蒙古语主观句子的文档s’;读取s’中的句子,选取所有词语元素,依次与蒙古语频用词列表比较,使用句子分割算法分割为若干不含杂质词语的带有单个情感方面的句子段,各句子段组成文档s”;使用短文本主题分析模型训练s”以对句子段进行分组,将具有相似情感方面的句子段分为一个主题,生成具有T个主题的文档S;概括每个主题中的句子段的情感方面,完成蒙古语情感方面抽取,本发明可提高主题情感方面抽取的准确度。
-
公开(公告)号:CN115130560A
公开(公告)日:2022-09-30
申请号:CN202210640789.1
申请日:2022-06-08
Applicant: 内蒙古工业大学
IPC: G06K9/62 , G06F40/289 , G06F40/253 , G06N3/08
Abstract: 一种融合极坐标的跨领域蒙古语情感分布学习方法,对蒙古语情感语料进行预处理操作;将极坐标融入普鲁契克情感轮中,为情感分布构造极坐标情绪表示法;构建基于对抗的域适应模型并融入加权多对抗网络结构;结合极坐标情绪表示法和域适应结构为模型构造损失函数;利用构造好的模型进行跨领域蒙古语情感分布学习的训练。本发明将极坐标的思想融入情感轮的心理学模型中,将情感分布表示为复合情绪向量,不仅降低了情感分布标签的维度,而且引入了新的损失用以促进情感分布的学习;本发明将域适应模型应用于蒙古语情感分布学习中,缓解了蒙古语情感分布语料匮乏的问题;并且本发明还能使得不同域的相同情绪文本实现更为准确的对齐。
-
公开(公告)号:CN114882373A
公开(公告)日:2022-08-09
申请号:CN202210319286.4
申请日:2022-03-29
Applicant: 内蒙古工业大学
Abstract: 一种基于深度神经网络的多特征融合沙尘暴预测方法,首先将以中国地面气候资料日值数据、中国强沙尘暴序列及其支撑数据为主的地面数据和以中国陆地区域云图(IR1)为主的云图数据进行预处理,使用时间滑动窗口的方式划分地面数据集,使其成为时间序列,能够有效提高数据的利用率;同时采用SMOTE算法和透视变换方法增强地面数据和卫星云图数据,缓解了数据不平衡问题;然后利用卷积神经网络提取卫星云图的空间特征,将其融合到地面数据中,使其成为输入属性;最后利用循环神经网络的时序记忆能力和卷积神经网络的特征提取能力,建立一种融合沙尘暴数据地面特性和空间特性的CNN‑LSTM沙尘暴预测模型,从而提高模型预测性能。
-
公开(公告)号:CN114818742A
公开(公告)日:2022-07-29
申请号:CN202210276166.0
申请日:2022-03-21
Applicant: 内蒙古工业大学
Abstract: 一种博弈型蒙古文神经机器翻译方法,将蒙古文神经机器翻译中影响译文解码的问题因素通过伪数据形式转化为干扰噪声;根据噪声干扰策略构建基于生成对抗网络的博弈模型,由生成器G、抗干扰器AJ和鉴别器D组成,在三个模块的博弈中完成对干扰噪声的泛化,提升博弈模型对这些噪声的翻译性能;在博弈训练中,利用REINFORCE策略对G进行参数优化,得到原始数据和噪声数据的训练奖励,借助对抗训练机制对原始语料和含干扰噪声的伪语料训练,利用AJ对训练数据的判断决策噪声数据的训练优先级,使G和D对添加的干扰噪声产生足够的解码能力,最终以训练得到的G为翻译模型,进行蒙古文翻译。本发明可提高蒙古文翻译的准确率和效率。
-
-
-
-
-
-
-
-
-