基于例子的机器翻译系统

    公开(公告)号:CN1475907A

    公开(公告)日:2004-02-18

    申请号:CN03145723.1

    申请日:2003-06-30

    Applicant: 微软公司

    CPC classification number: G06F17/2827

    Abstract: 本发明通过使将要被翻译的源语言句的片段与例库中的例子的源语言部分进行匹配,来执行机器翻译。当在例库中的所有有关的例子已被识别时,这些例子经历短语对准,其中,每个例子中的目标语言句的片段与同一例子中的源语言句的匹配片段进行对准。然后,翻译部件用来自匹配例子的被调准的目标语言短语来代替源语言句中的匹配的片段。

    基于例子的机器翻译系统和方法

    公开(公告)号:CN100440150C

    公开(公告)日:2008-12-03

    申请号:CN03145723.1

    申请日:2003-06-30

    Applicant: 微软公司

    CPC classification number: G06F17/2827

    Abstract: 本发明通过使将要被翻译的源语言句的片段与例库中的例子的源语言部分进行匹配,来执行机器翻译。当在例库中的所有有关的例子已被识别时,这些例子经历短语对准,其中,每个例子中的目标语言句的片段与同一例子中的源语言句的匹配片段进行对准。然后,翻译部件用来自匹配例子的被调准的目标语言短语来代替源语言句中的匹配的片段。

    检索确认句的方法和系统

    公开(公告)号:CN100507903C

    公开(公告)日:2009-07-01

    申请号:CN03124989.2

    申请日:2003-09-19

    Applicant: 微软公司

    CPC classification number: G06F16/3347 Y10S707/99933

    Abstract: 提供一种从句子数据库中检索确认句以响应查询的方法及系统。搜索引擎从句子数据库中检索确认句以响应查询。在检索确认句时,搜索引擎基于该查询定义索引单元,索引单元包括来自该查询的词条及和与该查询关联的扩展索引单元。然后搜索引擎使用已定义的索引单元作为搜索参数从句子数据库中检索到多个句子。多个检索到的句子中的每一个句子之间的相似性由搜索引擎确定,所述每个相似性作为查询中的一项的语言学权重的函数来确定。然后搜索引擎基于已确定的相似性排列多个检索到的句子。

    中文组块分析的方法及系统

    公开(公告)号:CN101377770A

    公开(公告)日:2009-03-04

    申请号:CN200710148214.3

    申请日:2007-08-27

    Applicant: 微软公司

    Inventor: 李沐 黄昌宁

    Abstract: 本发明提供一种中文组块分析的方法,能在相对较小的训练数据的基础上得到较精确的中文组块分析的结果,该中文组块分析方法利用了词的形态特征以及词的基于概率分布的相似性特征来作为标记模型的辅助的信息特征,以提高组块分析的准确度。该中文组块分析的技术能在训练数据量较小时有效提高组块分析的准确度,使得中文组块分析的应用能力得到很大的提高。

    检索确认句的方法和系统

    公开(公告)号:CN1490744A

    公开(公告)日:2004-04-21

    申请号:CN03124989.2

    申请日:2003-09-19

    Applicant: 微软公司

    CPC classification number: G06F16/3347 Y10S707/99933

    Abstract: 提供一种从句子数据库中检索确认句以响应查询的方法、计算机可读媒体及系统。搜索引擎从句子数据库中检索确认句以响应查询。在检索确认句时,搜索引擎基于该查询定义索引单元,索引单元包括来自该查询的词条及和与该查询关联的扩展索引单元。然后搜索引擎使用已定义的索引单元作为搜索参数从句子数据库中检索到多个句子。多个检索到的句子中的每一个句子之间的相似性由搜索引擎确定,所述每个相似性作为查询中的一项的语言学权重的函数来确定。然后搜索引擎基于已确定的相似性排列多个检索到的句子。

Patent Agency Ranking