-
公开(公告)号:CN116542261A
公开(公告)日:2023-08-04
申请号:CN202310386796.8
申请日:2023-04-12
Applicant: 厦门大学
IPC: G06F40/58 , G06F40/30 , G06F16/36 , G06N3/08 , G06F40/295
Abstract: 一种知识图谱增强的神经机器翻译模型构建方法,涉及自然语言处理、机器翻译、知识图谱等领域。从句子和知识图谱中实体的语义关系挖掘语义相近的实体对来替换原短语对生成伪句子对,并对生成伪句子对和原句子对的语义关系进一步挖掘来过滤语义不相似的伪句子对,而后利用原平行语料和伪平行语料联合训练神经机器翻译模型来提升未知实体的翻译质量。较于之前改善未知实体翻译的工作,从构造语义一致的未知实体的伪句子对的方向切入,一方面可以充分利用知识图谱中所有三元组的信息,另一方面显式构造伪数据易于模型学习如何对未知实体的句子翻译,从而增强神经翻译模型对未知实体的翻译质量。