一种利用半自回归融合领域术语的低资源机器翻译方法

    公开(公告)号:CN114492468A

    公开(公告)日:2022-05-13

    申请号:CN202111385350.0

    申请日:2021-11-22

    Inventor: 冯冲 许达 沙九

    Abstract: 本发明涉及一种利用半自回归融合领域术语的低资源机器翻译方法,属于自然语言处理机器翻译技术领域。本发明通过融合特定领域术语的低资源机器翻译方法,使用外部知识引导解码器,结合自回归与非自回归的解码方式,在引入先验知识的同时不牺牲解码效率,满足垂直领域的翻译需求。在半自回归的解码器中,将待生成的译文序列进行多组分块,块内采用自回归方式,块外采用非自回归方式。在推理阶段,分别通过删除历史译文中错误的词、插入先验知识术语约束词、预测合理的译文词并保留机制,从额外提供的约束中提取信息,进而融合外部先验知识。本发明不仅能够灵活融入外部先验知识,适应多领域不同翻译模型,相比自回归翻译方式大幅度提升了解码速率。

Patent Agency Ranking