基于语义预测的译文获取方法和设备

    公开(公告)号:CN101042692B

    公开(公告)日:2010-09-22

    申请号:CN200610066115.6

    申请日:2006-03-24

    Inventor: 方高林 于浩

    Abstract: 基于语义预测的译文获取方法和设备。所述方法输入一种源语言的查询项,输出该查询项在目标语言中的候选译文列表,其特征是,包括以下步骤:单元分割步骤,将输入的所述查询项尽可能地分割成有意义的候选单元集;单元译文知识库建立步骤,扩充所述候选单元在原始通用词典中的单元候选译文,并对扩充的单元候选译文进行评价形成单元译文知识库;语义预测步骤,利用基于所述单元译文知识库的语义预测的方法获得目标语言中与源语言中的所述查询项语义相关的项;有效网页获取步骤,将前述获得的语义相关项与所述查询项组合,利用组合后的项,通过搜索引擎获得有效网页;候选评价步骤,根据获取的有效网页,对候选译文进行评价得到候选译文列表。

    基于数据挖掘获取词或词组单元译文信息的系统和方法

    公开(公告)号:CN1928862A

    公开(公告)日:2007-03-14

    申请号:CN200510102518.7

    申请日:2005-09-08

    Abstract: 本发明为基于数据挖掘获取词或词组单元译文信息的系统和方法。包括:输入装置,用于输入词或词组单元;候选译文统计装置,根据输入所述的词或词组单元收集有效的电子文档和网页,在此基础上构建候选译文、发现候选译文的边界、统计候选译文的特征;候选译文噪声处理装置,用于对所述候选译文统计装置形成的噪声进行识别和处理;候选译文评价装置,根据所述候选译文统计装置得到的候选译文的特征,对每个可能的候选译文进行评价排序;候选译文典型例句挖掘装置,用于在Web上挖掘出候选译文的典型例句,并根据其典型程度排序;输出装置。使用户输入任意词典未收录的词或词组单元系统返回在另一种语言中按权值大小排列的翻译候选列表及其典型用法。

    基于数据挖掘获取词或词组单元译文信息的系统和方法

    公开(公告)号:CN100474301C

    公开(公告)日:2009-04-01

    申请号:CN200510102518.7

    申请日:2005-09-08

    Abstract: 本发明为基于数据挖掘获取词或词组单元译文信息的系统和方法。包括:输入装置,用于输入词或词组单元;候选译文统计装置,根据输入所述的词或词组单元收集有效的电子文档和网页,在此基础上构建候选译文、发现候选译文的边界、统计候选译文的特征;候选译文噪声处理装置,用于对所述候选译文统计装置形成的噪声进行识别和处理;候选译文评价装置,根据所述候选译文统计装置得到的候选译文的特征,对每个可能的候选译文进行评价排序;候选译文典型例句挖掘装置,用于在Web上挖掘出候选译文的典型例句,并根据其典型程度排序;输出装置。使用户输入任意词典未收录的词或词组单元系统返回在另一种语言中按权值大小排列的翻译候选列表及其典型用法。

    基于语义预测的译文获取方法和设备

    公开(公告)号:CN101042692A

    公开(公告)日:2007-09-26

    申请号:CN200610066115.6

    申请日:2006-03-24

    Inventor: 方高林 于浩

    Abstract: 基于语义预测的译文获取方法和设备。所述方法输入一种源语言的查询项,输出该查询项在目标语言中的候选译文列表,其特征是,包括以下步骤:单元分割步骤,将输入的所述查询项尽可能地分割成有意义的候选单元集;单元译文知识库建立步骤,扩充所述候选单元在原始通用词典中的单元候选译文,并对扩充的单元候选译文进行评价形成单元译文知识库;语义预测步骤,利用基于所述单元译文知识库的语义预测的方法获得目标语言中与源语言中的所述查询项语义相关的项;有效网页获取步骤,将前述获得的语义相关项与所述查询项组合,利用组合后的项,通过搜索引擎获得有效网页;候选评价步骤,根据获取的有效网页,对候选译文进行评价得到候选译文列表。

Patent Agency Ranking