一种融合句法结构的藏汉语言神经机器翻译方法

    公开(公告)号:CN112613326B

    公开(公告)日:2022-11-08

    申请号:CN202011500300.8

    申请日:2020-12-18

    Abstract: 本发明涉及一种融合句法结构的藏汉语言神经机器翻译方法,属于机器翻译及特征融合应用技术领域。本方法旨在在神经机器翻译的框架中,引入更多语言本身的句法结构,从而帮助提升机器翻译质量,通过优化transformer的位置编码技术问题,提出相对位置编码的方法,进行句法结构信息的融入。本方法通过提取基于依存关系的结构位置编码方法优化transformer,最终达到提升藏语‑汉语神经机器翻译质量的目的。本方法能有效提高自注意力神经网络在学习两种语言之间的关联的效率,缓解两种语言由于句法结构不同带来的问题,降低算法的时间复杂度,解决了传统模型采用绝对位置编码造成的上下文信息丢失问题,减少了低资源神经机器翻译的误翻译、漏翻译的发生。

    一种融合发音特征汉语-越南语统计机器翻译方法

    公开(公告)号:CN110096715A

    公开(公告)日:2019-08-06

    申请号:CN201910382004.3

    申请日:2019-05-06

    Abstract: 本发明公开了一种融合发音特征汉语-越南语统计机器翻译方法,属于机器翻译及特征融合应用技术领域。本方法通过汉语-越南语平行语料,利用统计得到的汉语拼音声母与越南语的元音、韵母与辅音以及声调之间的相关性,将基于纯汉字的汉语语料转换为汉字辅以拼音-声母-韵母-声调的格式,将基于纯音节的越南语语料转换成音节辅以元音-辅音-声调的格式;再将新格式语料输入机器翻译模型中进行训练,充分利用汉越双语独特的语言规律信息。所述方法降低了稀缺资源统计机器翻译对大规模语料的依赖,解决了传统基于短语的统计机器翻译不能融合发音特征的缺点,提升资源稀缺型语言间的机器翻译性能。

    一种融合句法结构的藏汉语言神经机器翻译方法

    公开(公告)号:CN112613326A

    公开(公告)日:2021-04-06

    申请号:CN202011500300.8

    申请日:2020-12-18

    Abstract: 本发明涉及一种融合句法结构的藏汉语言神经机器翻译方法,属于机器翻译及特征融合应用技术领域。本方法旨在在神经机器翻译的框架中,引入更多语言本身的句法结构,从而帮助提升机器翻译质量,通过优化transformer的位置编码技术问题,提出相对位置编码的方法,进行句法结构信息的融入。本方法通过提取基于依存关系的结构位置编码方法优化transformer,最终达到提升藏语‑汉语神经机器翻译质量的目的。本方法能有效提高自注意力神经网络在学习两种语言之间的关联的效率,缓解两种语言由于句法结构不同带来的问题,降低算法的时间复杂度,解决了传统模型采用绝对位置编码造成的上下文信息丢失问题,减少了低资源神经机器翻译的误翻译、漏翻译的发生。

Patent Agency Ranking