一种具有文档嵌入的神经机器翻译方法

    公开(公告)号:CN118690758A

    公开(公告)日:2024-09-24

    申请号:CN202410818693.9

    申请日:2024-06-24

    Applicant: 南通大学

    Abstract: 本发明提供了一种基于文档嵌入的神经机器翻译方法,属于自然语言处理技术领域。其技术方案为:首先,我们对语料库进行处理,针对具有明确边界的语料,将边界内的所有句子定义为一个文档,全局文档或者局部文档嵌入作为标记放在句子前,组合后的源嵌入和句子的目标翻译结果输入到模型中;然后,在语料库上训练一个文档级增强的神经机器翻译模型,该模型使用Transformer的编码器和解码器来处理输入的两组句子;接着,在编码器阶段有6个自注意力隐藏层和前馈层,来提取句子特征;最后,计算源句子和目标句子之间的相似度,以获得句子翻译的BLEU分数。本发明的有益效果为:预测准确率提高,帮助使用者更准确地获得文档的翻译结果。

Patent Agency Ranking