从非结构化资源挖掘短语对

    公开(公告)号:CN102439596B

    公开(公告)日:2015-07-22

    申请号:CN201080023190.9

    申请日:2010-05-14

    Applicant: 微软公司

    Abstract: 挖掘系统应用查询来从非结构化资源检索结果项。非结构化资源可以对应于可通过网络访问的资源项的储存库。被检索的结果项可以对应于与资源项相关联的文本段(例如,句子段)。挖掘系统通过过滤结果项和建立相应的结果项对,来产生结构化训练集。训练系统可以使用该训练集来产生统计翻译模型。翻译模型可以用于单语种上下文中,以在单一语言的语义相关的短语之间翻译。翻译模型也可以用于双语上下文中,以在以两种相应的语言表示的短语之间翻译。还描述了翻译模型的各种应用。

    将文本输入与词汇知识库相匹配并利用匹配结果的系统和方法

    公开(公告)号:CN1429370A

    公开(公告)日:2003-07-09

    申请号:CN01809516.X

    申请日:2001-05-16

    Applicant: 微软公司

    CPC classification number: G06F17/30684

    Abstract: 本发明可以被用于自然语言处理系统(100)中,以确定两个文本段之间的关系(例如,含义类似)。可以根据从文本段被生成的逻辑图表(例如,图3B、3C)来识别或确定该关系。确定第一个逻辑图表与第二个逻辑图表(图3B、3C)之间的关系。不管第一个逻辑图表与第二个逻辑图表(图3B、3C)之间是否有确切的匹配,都可以实现这一点。在一个实施例中,第一个图表(图3B)表示输入文本演讲单元。在一个实施例中,第二个图表(图3C)表示词汇知识库(LKB)(106)中的信息。即使输入图表和第二个图表在词汇或结构上有所不同,如果它们具有类似的含义,则两者也可以相互匹配。

    从非结构化资源挖掘短语对

    公开(公告)号:CN102439596A

    公开(公告)日:2012-05-02

    申请号:CN201080023190.9

    申请日:2010-05-14

    Applicant: 微软公司

    Abstract: 挖掘系统应用查询来从非结构化资源检索结果项。非结构化资源可以对应于可通过网络访问的资源项的储存库。被检索的结果项可以对应于与资源项相关联的文本段(例如,句子段)。挖掘系统通过过滤结果项和建立相应的结果项对,来产生结构化训练集。训练系统可以使用该训练集来产生统计翻译模型。翻译模型可以用于单语种上下文中,以在单一语言的语义相关的短语之间翻译。翻译模型也可以用于双语上下文中,以在以两种相应的语言表示的短语之间翻译。还描述了翻译模型的各种应用。

    将文本输入与词汇知识库相匹配并利用匹配结果的系统和方法

    公开(公告)号:CN1232920C

    公开(公告)日:2005-12-21

    申请号:CN01809516.X

    申请日:2001-05-16

    Applicant: 微软公司

    CPC classification number: G06F17/30684

    Abstract: 本发明可以被用于自然语言处理系统(100)中,以确定两个文本段之间的关系(例如,含义类似)。可以根据从文本段被生成的逻辑图表(例如,图3B、3C)来识别或确定该关系。确定第一个逻辑图表与第二个逻辑图表(图3B、3C)之间的关系。不管第一个逻辑图表与第二个逻辑图表(图3B、3C)之间是否有确切的匹配,都可以实现这一点。在一个实施例中,第一个图表(图3B)表示输入文本演讲单元。在一个实施例中,第二个图表(图3C)表示词汇知识库(LKB)(106)中的信息。即使输入图表和第二个图表在词汇或结构上有所不同,如果它们具有类似的含义,则两者也可以相互匹配。

Patent Agency Ranking