-
公开(公告)号:CN111310485B
公开(公告)日:2022-06-21
申请号:CN202010172133.2
申请日:2020-03-12
Applicant: 南京大学
IPC: G06F40/58 , G06F40/211 , G06F40/242
Abstract: 本公开涉及机器翻译领域,尤其涉及一种机器翻译方法、装置及存储介质。所述方法包括:根据待翻译的源端文本序列,调用编码器进行编码得到编码向量;根据编码向量,调用解码器进行解码得到中间结果;根据中间结果,通过总结层采用单头注意力得到当前时刻的词语对应的翻译概率分布,翻译概率分布用于指示多个候选词各自对应的选取概率;根据源端文本序列中各个词语的翻译概率分布,生成源端文本序列对应的目标译文。本公开实施例通过在包括编码器和解码器的机器翻译模型中增加一层总结层的方式,避免了相关技术中使用对多头注意力做剪枝、得到的注意力作为拷贝的注意力的情况,在保证解码速度的同时,提高了机器翻译模型的翻译质量。
-
公开(公告)号:CN111310485A
公开(公告)日:2020-06-19
申请号:CN202010172133.2
申请日:2020-03-12
Applicant: 南京大学
IPC: G06F40/58 , G06F40/211 , G06F40/242
Abstract: 本公开涉及机器翻译领域,尤其涉及一种机器翻译方法、装置及存储介质。所述方法包括:根据待翻译的源端文本序列,调用编码器进行编码得到编码向量;根据编码向量,调用解码器进行解码得到中间结果;根据中间结果,通过总结层采用单头注意力得到当前时刻的词语对应的翻译概率分布,翻译概率分布用于指示多个候选词各自对应的选取概率;根据源端文本序列中各个词语的翻译概率分布,生成源端文本序列对应的目标译文。本公开实施例通过在包括编码器和解码器的机器翻译模型中增加一层总结层的方式,避免了相关技术中使用对多头注意力做剪枝、得到的注意力作为拷贝的注意力的情况,在保证解码速度的同时,提高了机器翻译模型的翻译质量。
-