一种融合句法结构的藏汉语言神经机器翻译方法

    公开(公告)号:CN112613326B

    公开(公告)日:2022-11-08

    申请号:CN202011500300.8

    申请日:2020-12-18

    Abstract: 本发明涉及一种融合句法结构的藏汉语言神经机器翻译方法,属于机器翻译及特征融合应用技术领域。本方法旨在在神经机器翻译的框架中,引入更多语言本身的句法结构,从而帮助提升机器翻译质量,通过优化transformer的位置编码技术问题,提出相对位置编码的方法,进行句法结构信息的融入。本方法通过提取基于依存关系的结构位置编码方法优化transformer,最终达到提升藏语‑汉语神经机器翻译质量的目的。本方法能有效提高自注意力神经网络在学习两种语言之间的关联的效率,缓解两种语言由于句法结构不同带来的问题,降低算法的时间复杂度,解决了传统模型采用绝对位置编码造成的上下文信息丢失问题,减少了低资源神经机器翻译的误翻译、漏翻译的发生。

    一种基于特征衰减筛选的神经机器翻译方法

    公开(公告)号:CN114330377A

    公开(公告)日:2022-04-12

    申请号:CN202111485172.9

    申请日:2021-12-07

    Abstract: 本发明涉及一种基于特征衰减筛选的神经机器翻译方法,属于自然语言处理机器神经翻译领域。本方法针对源语言到目标语言的翻译任务,首先使用平行数据训练一个目标语言到源语言的反向翻译模型,然后使用该翻译模型对目标语言单语数据集进行反向翻译,得到初步的伪平行数据集。根据平行数据集的源语言文本创建句子特征集合,并为每个句子特征赋初始分数,按照特征衰减算法对伪数据集进行迭代选择,得到筛选后的伪数据集。将筛选后的伪数据集与平行数据集合并构建合成数据集,最后使用合成数据集训练源语言到目标语言的神经机器翻译模型。本方法避免了质量较差的伪数据对模型训练的不良影响,有效提高了模型的翻译效果。

    一种融合句法结构的藏汉语言神经机器翻译方法

    公开(公告)号:CN112613326A

    公开(公告)日:2021-04-06

    申请号:CN202011500300.8

    申请日:2020-12-18

    Abstract: 本发明涉及一种融合句法结构的藏汉语言神经机器翻译方法,属于机器翻译及特征融合应用技术领域。本方法旨在在神经机器翻译的框架中,引入更多语言本身的句法结构,从而帮助提升机器翻译质量,通过优化transformer的位置编码技术问题,提出相对位置编码的方法,进行句法结构信息的融入。本方法通过提取基于依存关系的结构位置编码方法优化transformer,最终达到提升藏语‑汉语神经机器翻译质量的目的。本方法能有效提高自注意力神经网络在学习两种语言之间的关联的效率,缓解两种语言由于句法结构不同带来的问题,降低算法的时间复杂度,解决了传统模型采用绝对位置编码造成的上下文信息丢失问题,减少了低资源神经机器翻译的误翻译、漏翻译的发生。

Patent Agency Ranking