-
公开(公告)号:CN102681985A
公开(公告)日:2012-09-19
申请号:CN201210152487.6
申请日:2012-05-16
Applicant: 中国科学院计算技术研究所
IPC: G06F17/28
Abstract: 一种面向形态丰富语言的翻译方法和系统,所述方法包括:步骤1,对形态丰富语言进行形态分析,获得词干和词缀信息;步骤2,在抽取翻译规则时,以词干作为原子翻译单元,并保留相应的词缀分布信息;步骤3,在翻译时,对于待翻译的片段,获取其词干、词缀分布;词干序列用来查询规则表,词缀分布信息和规则候选的词缀分布计算相似度,表征两者的相似程度,指导解码,所述词干序列是由多个词干组成的序列。