-
公开(公告)号:CN114021551A
公开(公告)日:2022-02-08
申请号:CN202010679242.3
申请日:2020-07-15
Applicant: 南京大学
IPC: G06F40/242 , G06F40/58 , G06K9/62 , G06N3/08
Abstract: 本公开涉及计算机技术领域,尤其涉及一种双语词典推断方法、装置及存储介质。所述方法包括:从平行语料中提取目标词典;根据提取出的所述目标词典和预配置的初始词典,训练得到目标双语词典推断模型,所述目标双语词典推断模型是具有将源端单词翻译为目标端单词的神经网络模型;其中,所述目标词典和所述初始词典均包括多个对齐词对,所述对齐词对包括源端单词和目标端单词。本公开实施例通过在初始字典的基础上引入平行语料,利用从平行语料中提取的目标词典来丰富目标双语词典推断模型的训练信息,提高了后续的双语词典推断效果。
-
公开(公告)号:CN116384414A
公开(公告)日:2023-07-04
申请号:CN202111567148.X
申请日:2021-12-20
Applicant: 中兴通讯股份有限公司 , 南京大学
IPC: G06F40/58 , G06F40/289 , G06F40/211 , G06F18/214
Abstract: 本申请实施例涉及机器学习技术领域,公开了一种机器翻译方法、装置、电子设备和存储介质。机器翻译方法包括以下步骤:获取待翻译语料数据;将词切分后的所述待翻译语料数据输入编码器,得到基于子词的上下文表示;将所述基于子词的上下文表示输入词表示合成器,得到基于词的上下文表示;将所述基于词的上下文表示输入解码器,得到所述待翻译语料数据的翻译结果。能够不受语种的限制,在任意语种之间进行有效、准确的翻译。
-