一种基于依存句法树的翻译规则抽取方法和翻译方法

    公开(公告)号:CN102799578A

    公开(公告)日:2012-11-28

    申请号:CN201210227973.X

    申请日:2012-07-02

    Inventor: 谢军 米海涛 刘群

    Abstract: 本发明提供基于依存句法树的翻译规则抽取方法及翻译方法,将翻译调序关系直接表示于源端为中心词及其所有修饰成分组成的依存句法树片段、目标端为串的翻译规则中,从而使翻译规则可以明确地指导翻译过程。通过这种方法抽取的翻译规则,可以提高了基于依存句法树的翻译方法的性能。在154万平行双语语料数据集上,本发明的依存句法树到串翻译模型的性能较成分树到串模型提高1.68个BLEU点。

    统计机器解码特征权重的训练方法和解码方法

    公开(公告)号:CN101989260A

    公开(公告)日:2011-03-23

    申请号:CN200910164808.2

    申请日:2009-08-01

    Abstract: 本发明提供一种统计机器解码方法,包括下列步骤:1)对于测试集的每个源语言句子,由单解码器生成测试集句子的翻译超图;2)将所述测试集句子的翻译超图压缩为测试集句子的共享压缩翻译超图;3)在所述测试集句子的共享压缩翻译超图上,进行联合解码,从所述联合解码所获得的多个最优译文中选择最终译文。根据上述方法进行统计机器解码,缓解了单解码器和系统融合的局限性,并且提高了译文翻译的准确性。

    统计机器解码特征权重的训练方法和解码方法

    公开(公告)号:CN101989260B

    公开(公告)日:2012-08-22

    申请号:CN200910164808.2

    申请日:2009-08-01

    Abstract: 本发明提供一种统计机器解码方法,包括下列步骤:1)对于测试集的每个源语言句子,由单解码器生成测试集句子的翻译超图;2)将所述测试集句子的翻译超图压缩为测试集句子的共享压缩翻译超图;3)在所述测试集句子的共享压缩翻译超图上,进行联合解码,从所述联合解码所获得的多个最优译文中选择最终译文。根据上述方法进行统计机器解码,缓解了单解码器和系统融合的局限性,并且提高了译文翻译的准确性。

    一种基于依存句法树的翻译规则抽取方法和翻译方法

    公开(公告)号:CN102243626A

    公开(公告)日:2011-11-16

    申请号:CN201110207750.2

    申请日:2011-07-22

    Inventor: 米海涛 刘群

    Abstract: 本发明提供基于依存句法树的翻译规则抽取方法及翻译方法,将翻译调序关系直接表示于源端为中心词及其所有修饰成分组成的依存句法树片段、目标端为串的翻译规则中,从而使翻译规则可以明确地指导翻译过程。通过这种方法抽取的翻译规则,可以提高了基于依存句法树的翻译方法的性能。在154万平行双语语料数据集上,本发明的依存句法树到串翻译模型的性能较成分树到串模型提高1.68个BLEU点。

    一种面向增量式翻译的结构化语言模型构建方法及系统

    公开(公告)号:CN102945231B

    公开(公告)日:2015-03-11

    申请号:CN201210401238.6

    申请日:2012-10-19

    Inventor: 于恒 米海涛 刘群

    Abstract: 本发明公开了一种面向增量式翻译的结构化语言模型构建方法及系统,该方法包括:步骤1,对增量式生成的翻译片段进行依存句法分析,得到依存树片段集合;步骤2,在依存树片段集合上抽取判别式特征实例,并利用判别式依存句法模型计算其特征分数。步骤3,根据特征分数对依存树片段集合进行剪枝,将特征分数最大值作为结构化语言模型的得分,保留结构化语言模型分数最高的片段,获得优化的依存树片段集合;步骤4,将下一个翻译片段通过移进-规约操作拼接到优化的依存树片段集合上,重复步骤1,2,3直到翻译结束,生成完整的依存树。本发明能在语言模型中融入句法信息和长距离依赖信息,在解码过程中为动态计算结构化语言模型提出有效的优化算法,提高了翻译质量。

    一种基于依存句法树的翻译规则抽取方法和翻译方法

    公开(公告)号:CN102799578B

    公开(公告)日:2014-11-05

    申请号:CN201210227973.X

    申请日:2012-07-02

    Inventor: 谢军 米海涛 刘群

    Abstract: 本发明提供基于依存句法树的翻译规则抽取方法及翻译方法,将翻译调序关系直接表示于源端为中心词及其所有修饰成分组成的依存句法树片段、目标端为串的翻译规则中,从而使翻译规则可以明确地指导翻译过程。通过这种方法抽取的翻译规则,可以提高了基于依存句法树的翻译方法的性能。在154万平行双语语料数据集上,本发明的依存句法树到串翻译模型的性能较成分树到串模型提高1.68个BLEU点。

    一种面向增量式翻译的结构化语言模型构建方法及系统

    公开(公告)号:CN102945231A

    公开(公告)日:2013-02-27

    申请号:CN201210401238.6

    申请日:2012-10-19

    Inventor: 于恒 米海涛 刘群

    Abstract: 本发明公开了一种面向增量式翻译的结构化语言模型构建方法及系统,该方法包括:步骤1,对增量式生成的翻译片段进行依存句法分析,得到依存树片段集合;步骤2,在依存树片段集合上抽取判别式特征实例,并利用判别式依存句法模型计算其特征分数。步骤3,根据特征分数对依存树片段集合进行剪枝,将特征分数最大值作为结构化语言模型的得分,保留结构化语言模型分数最高的片段,获得优化的依存树片段集合;步骤4,将下一个翻译片段通过移进-规约操作拼接到优化的依存树片段集合上,重复步骤1,2,3直到翻译结束,生成完整的依存树。本发明能在语言模型中融入句法信息和长距离依赖信息,在解码过程中为动态计算结构化语言模型提出有效的优化算法,提高了翻译质量。

    一种机器翻译方法
    8.
    发明授权

    公开(公告)号:CN101398815B

    公开(公告)日:2011-02-16

    申请号:CN200810114949.9

    申请日:2008-06-13

    Inventor: 米海涛 黄亮 刘群

    Abstract: 本发明提供一种机器翻译方法,包括以下步骤:步骤1)分析源语言串,得到源语言串的共享压缩句法森林;步骤2)根据已知的源语言与目标语言之间的翻译规则集合,对句法森林进行匹配,得到共享压缩翻译森林;步骤3)利用搜索算法遍历所述翻译森林生成最终翻译结果。本发明利用共享压缩森林来指导翻译,能够从大量的树中搜索翻译结果,远远超过了单独使用N-best树的搜索空间。在223万平行双语语料数据集上,与使用30-best树解码的模型相比,本发明的翻译速度快1.4倍、翻译性能高1.7个BLEU点。

    一种机器翻译方法
    9.
    发明公开

    公开(公告)号:CN101398815A

    公开(公告)日:2009-04-01

    申请号:CN200810114949.9

    申请日:2008-06-13

    Inventor: 米海涛 黄亮 刘群

    Abstract: 本发明提供一种机器翻译方法,包括以下步骤:步骤1)分析源语言串,得到源语言串的共享压缩句法森林;步骤2)根据已知的源语言与目标语言之间的翻译规则集合,对句法森林进行匹配,得到共享压缩翻译森林;步骤3)利用搜索算法遍历所述翻译森林生成最终翻译结果。本发明利用共享压缩森林来指导翻译,能够从大量的树中搜索翻译结果,远远超过了单独使用N-best树的搜索空间。在223万平行双语语料数据集上,与使用30-best树解码的模型相比,本发明的翻译速度快1.4倍、翻译性能高1.7个BLEU点。

Patent Agency Ranking