基于目标模板指导和关系头编码的蒙语方面级情感分析方法

    公开(公告)号:CN113657123A

    公开(公告)日:2021-11-16

    申请号:CN202110792911.2

    申请日:2021-07-14

    Abstract: 一种基于目标模板指导和关系头编码的蒙语方面级情感分析方法,从中文短语结构树中提取目标模板指导蒙汉神经机器翻译,将中文方面级情感语料翻译为蒙语方面级情感语料;利用蒙语依存句法解析器对蒙语方面级情感语料进行依存句法分析,得到蒙语依存分析树;对蒙语依存分析树进行重构,得到具有面向方面的树结构的蒙语依存分析树;采用图注意力神经网络模型,并添加关系头得到关系图注意力网络,对重构后的蒙语依存分析树中的依存关系进行编码,并建立方面和观点词之间的联系;训练所述关系图注意力网络使其能够对蒙语进行方面级情感分析,得到积极或者消极的情感极性,本发明提高了蒙语方面级情感分析的准确率。

    一种结合Bert语言模型和细粒度压缩的汉蒙翻译方法

    公开(公告)号:CN112395891A

    公开(公告)日:2021-02-23

    申请号:CN202011393610.4

    申请日:2020-12-03

    Abstract: 本发明为解决目前汉蒙机器翻译译文质量低、翻译效果不理想问题,提出了一种结合Bert语言模型和细粒度压缩的汉蒙翻译方法,首先,本发明从蒙古文的语言特点出发,将蒙古文数据进行词根、词缀的切分,将中文进行字粒度切分。其次,本发明采用当前比较先进的谷歌提供的已经预训练好的开源Bert语言模型,将Bert语言模型的输出直接送入每一层编码器中的Bert注意力模块中,这样可以有效把中文的语义信息融入编码器。最后,本发明结合细粒度压缩的方法,通过信息熵对信息表示进行细粒度压缩,从而达到模型加速推断的目的。本发明在进行蒙汉翻译的过程中,通过使用Bert语言模型引入更多的语义信息,使翻译准确度更高;通过使用细粒度压缩的方法使得模型能够有更快的训练速度。

    基于指针生成网络实现占位符消歧的蒙汉机器翻译方法

    公开(公告)号:CN112395892B

    公开(公告)日:2022-03-18

    申请号:CN202011393623.1

    申请日:2020-12-03

    Abstract: 一种基于指针生成网络实现占位符消歧的蒙汉机器翻译方法,基于编码器‑解码器架构,其特征在于,还包括辅助网络和骨干网络,所述辅助网络为每个输入源词汇位置生成一个二进制门,动态地选择要关注的词汇,所述骨干网络为带有门控机制的注意力的指针生成网络;编码阶段,经编码器的词嵌入层,将源文编码成一个隐藏层状态,再由所述门控机制决定来自当前状态的信息是流入还是被占位符替换;解码阶段,利用指针生成网络复制源文能力和生成新词汇能力,搭配占位符上下文语境进行消歧,给出符合上下文语义的精准词义,在最后数据输出前,利用附加模块进行语言学检查,检测到可能翻译异常的情况做出标注,通过调整相关参数以达到最好的翻译效果。

    一种基于知识图谱的蒙汉非自回归机器翻译方法

    公开(公告)号:CN113657125B

    公开(公告)日:2023-05-26

    申请号:CN202110793011.X

    申请日:2021-07-14

    Abstract: 一种基于知识图谱的蒙汉非自回归机器翻译方法,通过知识图谱三元组构建蒙汉双语命名实体语义网,并基于多特征对齐构建命名实体词典;然后借助知识图谱三元组表示蒙古语稀有词组成分布并进行稀有词切分,过程中进行交互式增强生成对抗训练,并添加交互信息指导生成对抗,得到全面的稀有词知识图谱三元组集;对经过处理之后的蒙汉平行语料库进行知识蒸馏,在教师模型通过知识蒸馏为学生模型提取语料时,构建蒙汉平行语料库的知识图谱;在进行非自回归机器翻译时,利用知识图谱作为投影矩阵训练集,经过双向嵌入映射共同训练得到投影矩阵,并进行解码信息润色。本发明可在保证翻译速率提高的前提下,提高机器翻译的译文质量。

    一种基于知识图谱的蒙汉非自回归机器翻译方法

    公开(公告)号:CN113657125A

    公开(公告)日:2021-11-16

    申请号:CN202110793011.X

    申请日:2021-07-14

    Abstract: 一种基于知识图谱的蒙汉非自回归机器翻译方法,通过知识图谱三元组构建蒙汉双语命名实体语义网,并基于多特征对齐构建命名实体词典;然后借助知识图谱三元组表示蒙古语稀有词组成分布并进行稀有词切分,过程中进行交互式增强生成对抗训练,并添加交互信息指导生成对抗,得到全面的稀有词知识图谱三元组集;对经过处理之后的蒙汉平行语料库进行知识蒸馏,在教师模型通过知识蒸馏为学生模型提取语料时,构建蒙汉平行语料库的知识图谱;在进行非自回归机器翻译时,利用知识图谱作为投影矩阵训练集,经过双向嵌入映射共同训练得到投影矩阵,并进行解码信息润色。本发明可在保证翻译速率提高的前提下,提高机器翻译的译文质量。

    一种基于讽刺识别和细粒度特征融合的多模态蒙古文情感分析方法

    公开(公告)号:CN113657115A

    公开(公告)日:2021-11-16

    申请号:CN202110825743.2

    申请日:2021-07-21

    Abstract: 本发明一种基于讽刺识别和细粒度特征融合的多模态蒙古文情感分析方法,首先,将机器翻译和情感分析结合,以解决由于蒙古语情感数据集的匮乏导致情感分析不准确的问题;其次,将图像属性纳入讽刺识别中,并利用属性特征和Bi‑GRU提取文本特征,使用Bi‑GRU替换Bi‑LSTM,缓解了Bi‑LSTM记忆单元结构复杂,训练时间长的问题;第三,结合图文相关性检测,以解决多模态情感分析中若存在配图和发布的文本完全无关的情况对分析结果造成较大偏差的问题;最后,结合多模态细粒度混合的方法,在多模态细粒度混合时根据上下文环境的差异,考虑到了各模态中不同组成成分的差别,从而避免噪音信息的影响。

    基于环顾解码和词汇注意力的非自回归蒙汉机器翻译方法

    公开(公告)号:CN112417901A

    公开(公告)日:2021-02-26

    申请号:CN202011393647.7

    申请日:2020-12-03

    Abstract: 本发明提出了一种基于环顾解码和词汇注意力的非自回归蒙汉机器翻译方法,通过使用环顾生成,减少重复生成的可能;通过使用词汇注意力,在运行解码器的每一层,让每个位置都关注整个词表,得到可能生成的字符,通过词汇注意力,解码器可以使得各个位置预期产生的字符进行交互,从而降低重复生成的可能,同时不需要引入额外的参数;本发明通过使用对齐交叉熵作为非自回归翻译模型的损失函数,解决了非自回归翻译模型中由于缺少自回归因子,难以对蒙语词序建模的问题;在解码时,采用动态双向解码,从而得到句子级别的更好的采样结果。本发明在蒙汉翻译的过程中加快解码速度的同时,也提升了翻译质量。

    基于指针生成网络实现占位符消歧的蒙汉机器翻译方法

    公开(公告)号:CN112395892A

    公开(公告)日:2021-02-23

    申请号:CN202011393623.1

    申请日:2020-12-03

    Abstract: 一种基于指针生成网络实现占位符消歧的蒙汉机器翻译方法,基于编码器‑解码器架构,其特征在于,还包括辅助网络和骨干网络,所述辅助网络为每个输入源词汇位置生成一个二进制门,动态地选择要关注的词汇,所述骨干网络为带有门控机制的注意力的指针生成网络;编码阶段,经编码器的词嵌入层,将源文编码成一个隐藏层状态,再由所述门控机制决定来自当前状态的信息是流入还是被占位符替换;解码阶段,利用指针生成网络复制源文能力和生成新词汇能力,搭配占位符上下文语境进行消歧,给出符合上下文语义的精准词义,在最后数据输出前,利用附加模块进行语言学检查,检测到可能翻译异常的情况做出标注,通过调整相关参数以达到最好的翻译效果。

Patent Agency Ranking