-
公开(公告)号:CN102439596B
公开(公告)日:2015-07-22
申请号:CN201080023190.9
申请日:2010-05-14
Applicant: 微软公司
Abstract: 挖掘系统应用查询来从非结构化资源检索结果项。非结构化资源可以对应于可通过网络访问的资源项的储存库。被检索的结果项可以对应于与资源项相关联的文本段(例如,句子段)。挖掘系统通过过滤结果项和建立相应的结果项对,来产生结构化训练集。训练系统可以使用该训练集来产生统计翻译模型。翻译模型可以用于单语种上下文中,以在单一语言的语义相关的短语之间翻译。翻译模型也可以用于双语上下文中,以在以两种相应的语言表示的短语之间翻译。还描述了翻译模型的各种应用。
-
公开(公告)号:CN102439596A
公开(公告)日:2012-05-02
申请号:CN201080023190.9
申请日:2010-05-14
Applicant: 微软公司
Abstract: 挖掘系统应用查询来从非结构化资源检索结果项。非结构化资源可以对应于可通过网络访问的资源项的储存库。被检索的结果项可以对应于与资源项相关联的文本段(例如,句子段)。挖掘系统通过过滤结果项和建立相应的结果项对,来产生结构化训练集。训练系统可以使用该训练集来产生统计翻译模型。翻译模型可以用于单语种上下文中,以在单一语言的语义相关的短语之间翻译。翻译模型也可以用于双语上下文中,以在以两种相应的语言表示的短语之间翻译。还描述了翻译模型的各种应用。
-