-
公开(公告)号:CN114742046B
公开(公告)日:2025-05-20
申请号:CN202210252395.9
申请日:2022-03-15
Applicant: 内蒙古工业大学
IPC: G06F40/284 , G06F18/2415 , G06F18/2431 , G06F18/25 , G06N3/045 , G06N3/0464 , G06N3/08
Abstract: 一种融合词根词缀和音标的蒙古语预训练情感分析方法,对蒙古语语料进行预处理;构建蒙古语BERT预训练模型,其中,在其嵌入层构造词嵌入、词根嵌入、词缀嵌入和音标嵌入;将所述嵌入进行拼接后得到融合嵌入,然后再将融合嵌入与位置嵌入相加,形成模型输入;在蒙古语BERT预训练模型中,将对比学习和MLM的融合任务进行预训练;对蒙古语情感语料进行预处理;用训练好的融合词根词缀和音标的蒙古语BERT预训练模型对蒙古语情感语料进行情感分析。本发明采用融合词根词缀和音标对BERT模型进行预训练,另外,将对比学习的方法融入到MLM任务中,通过对比学习来实现数据增强,从而提高模型的准确率和情感分析的准确性。
-
公开(公告)号:CN115100694B
公开(公告)日:2025-04-22
申请号:CN202210688307.X
申请日:2022-06-17
Applicant: 内蒙古工业大学
IPC: G06V40/12 , G06N3/0455 , G06N3/0895 , G06N3/084 , G06V10/82
Abstract: 一种基于自监督神经网络的指纹快速检索方法,构建指纹特征提取器模型并进行预训练;模型主体采用线性投射层加Transformer编码器的结构;将预训练过的指纹特征提取器模型迁移到指纹图片上,用自监督学习的方式再次训练;构建指纹图片重构器模型,然后与自监督学习得到的指纹特征提取器模型连接,利用指纹重构任务使指纹特征提取器模型对指纹特征的抽取能力进一步提升;用指纹图片重构任务训练得到的指纹特征提取器模型对指纹库中的指纹图片逐一进行特征提取,建立指纹索引库;用查询指纹在指纹索引库检索得到候选指纹序列。本发明可在大规模指纹检索中直接利用原始指纹图片进行自动特征提取,并可提高指纹检索的精度和效率。
-
公开(公告)号:CN115099245A
公开(公告)日:2022-09-23
申请号:CN202210542568.0
申请日:2022-05-18
Applicant: 内蒙古工业大学
Abstract: 一种卷积增强的蒙汉神经机器翻译方法,分别对蒙古语数据与汉语数据进行预处理;基于Transformer网络构建翻译模型,所述翻译模型包括输入模块、Conformer模块、Decoder模块和输出模块;对翻译模型进行训练;使用BLUE值对翻译模型进行评价。本发明充分利用Transformer的结构优点,提高翻译模型局部信息的捕捉。本发明修改了Transformer编码器的结构,将卷积神经网络与Transformer相结合,对句子进行全局与局部的建模,将实现全局与局部的最佳,提高了翻译译文的BLUE值。
-
公开(公告)号:CN114925682A
公开(公告)日:2022-08-19
申请号:CN202210701921.5
申请日:2022-06-21
Applicant: 内蒙古工业大学
IPC: G06F40/279 , G06F40/211 , G06F40/30 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 一种基于知识感知注意力网络的多模态融合的蒙古语谣言检测方法,提取新闻内容的图像特征和文本特征,并融合得到一个多模态融合的特征图;引入图注意力网络,为特征图的每个节点分配不同的权重;提取新闻内容中的实体,并与知识图谱中的对应实体对齐,得到实体序列,并进一步得到实体的外部知识,即实体上下文序列;将多模态融合的新闻内容、实体和实体上下文作为输入,提取实体和实体上下文的语义特征;构建注意力网络,得到不同位置的不同子空间的表示信息;将多模态新闻内容表示、实体表示和实体上下文表示串联起来得到新闻内容的最终表示,输入到全连接层得到新闻内容是谣言的概率。本发明可有效提升蒙古语谣言检测的准确性。
-
公开(公告)号:CN113657129A
公开(公告)日:2021-11-16
申请号:CN202111039187.2
申请日:2021-09-06
Applicant: 内蒙古工业大学
Abstract: 一种结合生成对抗网络与近端优化策略的蒙汉神经机器翻译方法,将蒙古文数据和中文数据进行预处理,以处理后的蒙古文数据和中文数据作为源数据,将其传入基于GAN模型的生成器G,所述生成器G引入了近端优化策略,以不断调整产生的译文,利用判别器D鉴别生成器G生成的译文,进行对抗训练,整个对抗训练目标近似为最大和最小的纳什均衡状态,即生成器最大和判别器最小的博弈。本发明采用基于近端优化策略的强化训练方法,并且在生成对抗网络模型基础上构建了基于GAN的噪声泛化训练策略。
-
公开(公告)号:CN113657122B
公开(公告)日:2023-12-15
申请号:CN202111044287.4
申请日:2021-09-07
Applicant: 内蒙古工业大学
IPC: G06F40/42 , G06F40/44 , G06F40/58 , G06N3/096 , G06F40/289
Abstract: 一种融合迁移学习的伪平行语料库的蒙汉机器翻译方法,通过大规模的英汉平行语料库训练一个英汉神经机器翻译模型;对蒙古语进行预处理后构建蒙汉神经机器翻译模型;将训练好的英汉神经机器翻译模型的模型参数权重迁移到蒙汉神经机器翻译模型中;将现有的蒙汉平行语料库对蒙汉神经机器翻译模型进行完善训练,用完善好的蒙汉神经机器翻译模型对现有的蒙汉平行语料库中的汉语单语语料进行回译、加噪,形成一个伪平行语料库D1;将伪平行语料库D1和现有的蒙汉平行语料库融合形成伪平行语料库D;用伪平行语料库D重新训练完善好的蒙汉神经机器翻译模型,得到最终的蒙汉神经机器翻译模(56)对比文件吴一琦.融合句法分析的无监督神经机器翻译《.中国优秀硕士学位论文全文数据库哲学与人文科学辑》.2020,(第06期),F084-32.Wang Yijun 等.Dual transfer learningfor neural machine translation withmarginal distribution regularization.《Proceedings of the AAAI Conference onArtificial Intelligence》.2018,第32卷(第1期),5553-5560.范婷婷.基于微调的无监督域适应蒙汉神经机器翻译的研究《.中国优秀硕士学位论文全文数据库 信息科技辑》.2022,(第01期),I138-3777.
-
公开(公告)号:CN115130560A
公开(公告)日:2022-09-30
申请号:CN202210640789.1
申请日:2022-06-08
Applicant: 内蒙古工业大学
IPC: G06K9/62 , G06F40/289 , G06F40/253 , G06N3/08
Abstract: 一种融合极坐标的跨领域蒙古语情感分布学习方法,对蒙古语情感语料进行预处理操作;将极坐标融入普鲁契克情感轮中,为情感分布构造极坐标情绪表示法;构建基于对抗的域适应模型并融入加权多对抗网络结构;结合极坐标情绪表示法和域适应结构为模型构造损失函数;利用构造好的模型进行跨领域蒙古语情感分布学习的训练。本发明将极坐标的思想融入情感轮的心理学模型中,将情感分布表示为复合情绪向量,不仅降低了情感分布标签的维度,而且引入了新的损失用以促进情感分布的学习;本发明将域适应模型应用于蒙古语情感分布学习中,缓解了蒙古语情感分布语料匮乏的问题;并且本发明还能使得不同域的相同情绪文本实现更为准确的对齐。
-
公开(公告)号:CN114742064B
公开(公告)日:2025-05-09
申请号:CN202210264289.2
申请日:2022-03-17
Applicant: 内蒙古工业大学
IPC: G06F40/30 , G06F40/58 , G06F40/126 , G06F40/284 , G06F40/211 , G06N3/045 , G06N3/084 , G06N3/0895
Abstract: 一种基于预训练胶囊网络的蒙古语方面级情感分析方法,收集整理语料,构建汉蒙神经机器翻译模型,用汉蒙平行语料进行训练,将有标注的汉语情感语料翻译为蒙语情感语料;基于深度注意力胶囊网络构建用于预训练的模型,用无标注的蒙语文本语料对构建的模型进行预训练,得到预训练过的蒙语语言模型;用蒙语情感语料对蒙语语言模型进行情感增强预训练;最后利用方面级蒙语文本情感语料对情感增强后的模型进行微调,本发明可解决蒙古语有标注文本稀缺的问题,并提高了蒙古语情感分析结果的精度。
-
公开(公告)号:CN114817466A
公开(公告)日:2022-07-29
申请号:CN202210397932.9
申请日:2022-04-16
Applicant: 内蒙古工业大学
IPC: G06F16/33 , G06F16/35 , G06F40/216 , G06F40/295 , G06F40/30 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 一种主客观可解释的双向图神经网络的蒙古语谣言检测方法,利用证据检索模块检索证据,包含文档检索、证据检索和声明验证;构造双向树形图和证据星形图两个异构图,双向树形图利用具有自顶向下的谣言传播有向图的图卷积神经网络学习谣言传播模式;利用具有自底向上的谣言扩散图的图卷积神经网络捕获谣言扩散模式;证据星形图中,将源帖子即检测对象位于中心,证据节点围绕其周围,表示星形结构中的一个角度;基于双向树形图构造谣言检测模型;基于双向树结构和星形结构的信息传输的K次迭代后,得到两种嵌入结果的最终表示,将其连接后传递到多层感知机中进行最终预测;利用该模型可进行蒙古语谣言检测并得到分类标签和证据解释。
-
公开(公告)号:CN114742046A
公开(公告)日:2022-07-12
申请号:CN202210252395.9
申请日:2022-03-15
Applicant: 内蒙古工业大学
IPC: G06F40/284 , G06F40/289 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 一种融合词根词缀和音标的蒙古语预训练情感分析方法,对蒙古语语料进行预处理;构建蒙古语BERT预训练模型,其中,在其嵌入层构造词嵌入、词根嵌入、词缀嵌入和音标嵌入;将所述嵌入进行拼接后得到融合嵌入,然后再将融合嵌入与位置嵌入相加,形成模型输入;在蒙古语BERT预训练模型中,将对比学习和MLM的融合任务进行预训练;对蒙古语情感语料进行预处理;用训练好的融合词根词缀和音标的蒙古语BERT预训练模型对蒙古语情感语料进行情感分析。本发明采用融合词根词缀和音标对BERT模型进行预训练,另外,将对比学习的方法融入到MLM任务中,通过对比学习来实现数据增强,从而提高模型的准确率和情感分析的准确性。
-
-
-
-
-
-
-
-
-