从非结构化资源挖掘短语对

    公开(公告)号:CN102439596B

    公开(公告)日:2015-07-22

    申请号:CN201080023190.9

    申请日:2010-05-14

    Applicant: 微软公司

    Abstract: 挖掘系统应用查询来从非结构化资源检索结果项。非结构化资源可以对应于可通过网络访问的资源项的储存库。被检索的结果项可以对应于与资源项相关联的文本段(例如,句子段)。挖掘系统通过过滤结果项和建立相应的结果项对,来产生结构化训练集。训练系统可以使用该训练集来产生统计翻译模型。翻译模型可以用于单语种上下文中,以在单一语言的语义相关的短语之间翻译。翻译模型也可以用于双语上下文中,以在以两种相应的语言表示的短语之间翻译。还描述了翻译模型的各种应用。

    从非结构化资源挖掘短语对

    公开(公告)号:CN102439596A

    公开(公告)日:2012-05-02

    申请号:CN201080023190.9

    申请日:2010-05-14

    Applicant: 微软公司

    Abstract: 挖掘系统应用查询来从非结构化资源检索结果项。非结构化资源可以对应于可通过网络访问的资源项的储存库。被检索的结果项可以对应于与资源项相关联的文本段(例如,句子段)。挖掘系统通过过滤结果项和建立相应的结果项对,来产生结构化训练集。训练系统可以使用该训练集来产生统计翻译模型。翻译模型可以用于单语种上下文中,以在单一语言的语义相关的短语之间翻译。翻译模型也可以用于双语上下文中,以在以两种相应的语言表示的短语之间翻译。还描述了翻译模型的各种应用。

Patent Agency Ranking