-
公开(公告)号:CN104750687A
公开(公告)日:2015-07-01
申请号:CN201310728270.X
申请日:2013-12-25
Applicant: 株式会社东芝
CPC classification number: G06F17/2827
Abstract: 本发明的实施方式提供了用于改进双语语料库的方法、用于改进双语语料库的装置、机器翻译方法以及机器翻译装置。根据本发明的一个方面,提供了一种用于改进双语语料库的装置,其中,上述双语语料库包括多个第一语种和第二语种的句对以及每个句对之间的词对齐信息,上述装置包括:提取单元,其在给定的句对的词对齐信息中提取切分候选;计算单元,其计算上述切分候选的切分置信度;比较单元,其对上述切分置信度和预定的阈值进行比较;以及切分单元,其在上述切分置信度大于等于上述阈值的情况下,在上述切分候选处对上述给定的句对进行切分。
-
公开(公告)号:CN104933038A
公开(公告)日:2015-09-23
申请号:CN201410104256.7
申请日:2014-03-20
Applicant: 株式会社东芝
Abstract: 本发明提供一种能够改善翻译质量的动态的机器翻译方法和机器翻译装置。本发明的一个实施方式的机器翻译装置,包括:输入单元,其输入待翻译的句子;计算单元,其计算上述待翻译的句子和双语语料库中的源语言句子之间的相似度;选择单元,其基于上述相似度在上述双语语料库中选择多个句子对,作为训练语料;训练单元,其利用上述训练语料,训练翻译系统;以及翻译单元,其利用上述翻译系统,对上述待翻译的句子进行翻译。
-