一种基于字符编码的深度神经翻译方法及系统

    公开(公告)号:CN106126507A

    公开(公告)日:2016-11-16

    申请号:CN201610457514.9

    申请日:2016-06-22

    Inventor: 张海军 李婧萱

    CPC classification number: G06F17/2827 G06F17/2818

    Abstract: 本发明提出了一种基于字符编码的深度神经翻译方法及系统,使用递归神经网络(Recurrent Neural Network,RNN)建立一个联合的神经网络模型来覆盖整个翻译过程,从编码器‑解码器框架的角度直接完成翻译任务。方法包括:A、词向量生成:将字符级别的输入数据通过神经网络建模进行分词,并生成词向量;B、语言模型生成:利用递归神经网络在时间上具有记忆性的特点,建立语法规则;C、词对齐模型生成:得到对源语言语句中多个词翻译成目标语言词的概率;D、输出:将输入的源语言翻译成目标语言;E、联合翻译模型:将上述4个步骤的神经网络模型联合起来,建立一个基于字符编码的深度神经翻译模型(RNN‑embed),并使用GPU并行计算来加速模型的训练。

    一种基于字符编码的深度神经翻译方法及系统

    公开(公告)号:CN106126507B

    公开(公告)日:2019-08-09

    申请号:CN201610457514.9

    申请日:2016-06-22

    Inventor: 张海军 李婧萱

    Abstract: 本发明提出了一种基于字符编码的深度神经翻译方法及系统,使用递归神经网络(Recurrent Neural Network,RNN)建立一个联合的神经网络模型来覆盖整个翻译过程,从编码器‑解码器框架的角度直接完成翻译任务。方法包括:A、词向量生成:将字符级别的输入数据通过神经网络建模进行分词,并生成词向量;B、语言模型生成:利用递归神经网络在时间上具有记忆性的特点,建立语法规则;C、词对齐模型生成:得到对源语言语句中多个词翻译成目标语言词的概率;D、输出:将输入的源语言翻译成目标语言;E、联合翻译模型:将上述4个步骤的神经网络模型联合起来,建立一个基于字符编码的深度神经翻译模型(RNN‑embed),并使用GPU并行计算来加速模型的训练。

Patent Agency Ranking