-
公开(公告)号:CN102439596B
公开(公告)日:2015-07-22
申请号:CN201080023190.9
申请日:2010-05-14
Applicant: 微软公司
Abstract: 挖掘系统应用查询来从非结构化资源检索结果项。非结构化资源可以对应于可通过网络访问的资源项的储存库。被检索的结果项可以对应于与资源项相关联的文本段(例如,句子段)。挖掘系统通过过滤结果项和建立相应的结果项对,来产生结构化训练集。训练系统可以使用该训练集来产生统计翻译模型。翻译模型可以用于单语种上下文中,以在单一语言的语义相关的短语之间翻译。翻译模型也可以用于双语上下文中,以在以两种相应的语言表示的短语之间翻译。还描述了翻译模型的各种应用。
-
公开(公告)号:CN1429370A
公开(公告)日:2003-07-09
申请号:CN01809516.X
申请日:2001-05-16
Applicant: 微软公司
IPC: G06F17/20
CPC classification number: G06F17/30684
Abstract: 本发明可以被用于自然语言处理系统(100)中,以确定两个文本段之间的关系(例如,含义类似)。可以根据从文本段被生成的逻辑图表(例如,图3B、3C)来识别或确定该关系。确定第一个逻辑图表与第二个逻辑图表(图3B、3C)之间的关系。不管第一个逻辑图表与第二个逻辑图表(图3B、3C)之间是否有确切的匹配,都可以实现这一点。在一个实施例中,第一个图表(图3B)表示输入文本演讲单元。在一个实施例中,第二个图表(图3C)表示词汇知识库(LKB)(106)中的信息。即使输入图表和第二个图表在词汇或结构上有所不同,如果它们具有类似的含义,则两者也可以相互匹配。
-
公开(公告)号:CN102439596A
公开(公告)日:2012-05-02
申请号:CN201080023190.9
申请日:2010-05-14
Applicant: 微软公司
Abstract: 挖掘系统应用查询来从非结构化资源检索结果项。非结构化资源可以对应于可通过网络访问的资源项的储存库。被检索的结果项可以对应于与资源项相关联的文本段(例如,句子段)。挖掘系统通过过滤结果项和建立相应的结果项对,来产生结构化训练集。训练系统可以使用该训练集来产生统计翻译模型。翻译模型可以用于单语种上下文中,以在单一语言的语义相关的短语之间翻译。翻译模型也可以用于双语上下文中,以在以两种相应的语言表示的短语之间翻译。还描述了翻译模型的各种应用。
-
公开(公告)号:CN1232920C
公开(公告)日:2005-12-21
申请号:CN01809516.X
申请日:2001-05-16
Applicant: 微软公司
IPC: G06F17/20
CPC classification number: G06F17/30684
Abstract: 本发明可以被用于自然语言处理系统(100)中,以确定两个文本段之间的关系(例如,含义类似)。可以根据从文本段被生成的逻辑图表(例如,图3B、3C)来识别或确定该关系。确定第一个逻辑图表与第二个逻辑图表(图3B、3C)之间的关系。不管第一个逻辑图表与第二个逻辑图表(图3B、3C)之间是否有确切的匹配,都可以实现这一点。在一个实施例中,第一个图表(图3B)表示输入文本演讲单元。在一个实施例中,第二个图表(图3C)表示词汇知识库(LKB)(106)中的信息。即使输入图表和第二个图表在词汇或结构上有所不同,如果它们具有类似的含义,则两者也可以相互匹配。
-
-
-