-
公开(公告)号:CN116306704B
公开(公告)日:2023-08-22
申请号:CN202310557293.2
申请日:2023-05-17
Applicant: 鹏城实验室
IPC: G06F40/58 , G06F40/126 , G06F40/194 , G06F40/30 , G06N3/0499 , G06N3/092
Abstract: 本申请提供了篇章级文本机器翻译方法、系统、设备及介质,属于自然语言技术领域。方法包括:获取待翻译的目标句子和对应的上下文信息;对目标句子和上下文信息进行编码,得到结合上下文信息编码后的第一隐藏层状态信息;对目标句子进行编码,得到单独编码后的第二隐藏层状态信息;将第一隐藏层状态信息和第二隐藏层状态信息输入到预置的判别模型中,得到进行语义相似度计算后输出的模型输出信息;根据模型输出信息确定目标句子对上下文信息的依赖性信息,根据依赖性信息对满足依赖关系的目标句子和上下文信息进行翻译操作。本申请针对性选择上下文信息进行翻译,机器翻译过程中会关注不同语句对于上下文信息的依赖性差别,提高机器翻译的质量。
-
公开(公告)号:CN116362265A
公开(公告)日:2023-06-30
申请号:CN202310595862.2
申请日:2023-05-25
Applicant: 鹏城实验室
IPC: G06F40/58 , G06F40/42 , G06F40/126 , G06F40/226 , G06F40/166
Abstract: 本发明实施例提供文本翻译方法、装置、设备和存储介质,涉及人工智能技术领域。该方法包括:通过对源语言句子进行编码,得到第一隐藏层向量;然后根据第一隐藏层向量执行迭代翻译过程,在迭代翻译过程中对预测序列的错误进行定位,将错误词语进行掩码后重新预测,直至满足迭代结束条件,将预测序列作为源语言句子的目标语言翻译句子。本申请实施例针对非自回归文本翻译,利用迭代式解码机制提升翻译性能,不同于一次性生成翻译结果的方式,并且其通过迭代翻译过程多次微调中间翻译结果的预测序列,准确判断生成的预测序列中词语的正确性,对其进行错误进行定位,根据定位结果替换需要修改的预测词,能够提升推理速度以及翻译结果。
-
公开(公告)号:CN115952809A
公开(公告)日:2023-04-11
申请号:CN202211709287.6
申请日:2022-12-29
Applicant: 鹏城实验室
IPC: G06F40/58 , G06F40/242 , G06N3/08 , G06F16/36 , G06F40/216 , G06F40/289 , G06F18/22 , G06N3/04
Abstract: 本发明公开了一种基于图网络的多语言翻译的词表初始化方法及装置,包括:根据每种语言对应的双语词典、词语及词元的分解构成关系,构建每种语言与核心语言之间的词表映射异质图;根据异质图神经网络和对比学习算法,在词表映射异质图上学习不同语言词表与核心语言词表之间的词元映射关系;将多语言机器翻译任务中的核心语言词表的词元利用核心语言BERT模型的词表进行初始化,并根据词元映射关系将其他语言映射到核心语言BERT模型的词表空间,完成多语言机器翻译任务中所有词元的初始化。本发明利用构建词元异质图的方式来完成不同语言词元的映射来初始化词元,提高了多语言机器翻译模型的翻译准确率,同时也加快了模型收敛速度。
-
公开(公告)号:CN116306704A
公开(公告)日:2023-06-23
申请号:CN202310557293.2
申请日:2023-05-17
Applicant: 鹏城实验室
IPC: G06F40/58 , G06F40/126 , G06F40/194 , G06F40/30 , G06N3/0499 , G06N3/092
Abstract: 本申请提供了篇章级文本机器翻译方法、系统、设备及介质,属于自然语言技术领域。方法包括:获取待翻译的目标句子和对应的上下文信息;对目标句子和上下文信息进行编码,得到结合上下文信息编码后的第一隐藏层状态信息;对目标句子进行编码,得到单独编码后的第二隐藏层状态信息;将第一隐藏层状态信息和第二隐藏层状态信息输入到预置的判别模型中,得到进行语义相似度计算后输出的模型输出信息;根据模型输出信息确定目标句子对上下文信息的依赖性信息,根据依赖性信息对满足依赖关系的目标句子和上下文信息进行翻译操作。本申请针对性选择上下文信息进行翻译,机器翻译过程中会关注不同语句对于上下文信息的依赖性差别,提高机器翻译的质量。
-
-
-