一种博弈型蒙古文神经机器翻译方法

    公开(公告)号:CN114818742A

    公开(公告)日:2022-07-29

    申请号:CN202210276166.0

    申请日:2022-03-21

    Abstract: 一种博弈型蒙古文神经机器翻译方法,将蒙古文神经机器翻译中影响译文解码的问题因素通过伪数据形式转化为干扰噪声;根据噪声干扰策略构建基于生成对抗网络的博弈模型,由生成器G、抗干扰器AJ和鉴别器D组成,在三个模块的博弈中完成对干扰噪声的泛化,提升博弈模型对这些噪声的翻译性能;在博弈训练中,利用REINFORCE策略对G进行参数优化,得到原始数据和噪声数据的训练奖励,借助对抗训练机制对原始语料和含干扰噪声的伪语料训练,利用AJ对训练数据的判断决策噪声数据的训练优先级,使G和D对添加的干扰噪声产生足够的解码能力,最终以训练得到的G为翻译模型,进行蒙古文翻译。本发明可提高蒙古文翻译的准确率和效率。

    一种基于多约束项的蒙汉神经机器翻译方法

    公开(公告)号:CN114818743A

    公开(公告)日:2022-07-29

    申请号:CN202210277518.4

    申请日:2022-03-21

    Abstract: 一种基于多约束项的蒙汉神经机器翻译方法,首先针对蒙汉神经机器翻译任务构建基于强化学习的模型训练过程,然后在强化模型基础上针对训练的优化目标进一步改进约束条件,包括:添加语义约束模块以缓解单一的BLEU值评价体系带来的译文流利度差的问题;针对训练过程进行参数约束以提升模型训练的效率;对语料进行词表约束以减少译文中未登录词的数量。本发明通过调节整体约束方式,减轻低资源蒙汉机器翻译任务中模型对序列结构分析能力差和训练效率低的问题,同时对于强化训练带来的方差较大问题,本发明采取均值奖励和剪枝柱搜索的方法有效地缓解以上强化训练带来的负面影响。

Patent Agency Ranking