-
-
公开(公告)号:CN101470704A
公开(公告)日:2009-07-01
申请号:CN200710301583.1
申请日:2007-12-25
Applicant: 富士施乐株式会社
IPC: G06F17/28
Abstract: 本发明提供可高精度地提取对译文提取装置及对译文提取方法。该装置具有:计算单元,其使用通过对第1语言所记载的第1文及第2语言所记载的第2文的统计处理而得到的统计信息,计算表示第1文和第2文类似的程度的指标;提取单元,其根据计算单元所计算出的指标从构成第2语言所表示的第2文章的文中提取被考虑为第1文的对译文的提取文;调节单元,其根据表示将提取单元所提取出的提取文及构成第2文章的其他第2文合并的合并文、和第1文类似的程度的指标,将第1文的对译文从提取文调节为合并文。根据该结构,将对译文从使用根据统计信息所计算的指标而提取出的文调节为将所提取出的文和其他文合并的文,所以可高精度地提取对译文。
-
公开(公告)号:CN100474288C
公开(公告)日:2009-04-01
申请号:CN200510053706.5
申请日:2005-03-10
Applicant: 富士施乐株式会社
IPC: G06F17/00
CPC classification number: G06F17/2735
Abstract: 本发明涉及学习装置及其更新方法。在该学习装置中,存储器以可更新的方式存储词典,输入装置在由用户输入指令时输入数据。输出部通过使用存储在存储器中的词典来处理经输入部输入的数据,并输出处理的结果。标识符接收器获得用户的标识符或用户所属组的标识符。更新装置仅在标识符接收器获得的标识符预先注册在存储器中时才更新词典。
-
公开(公告)号:CN101546304A
公开(公告)日:2009-09-30
申请号:CN200810183795.9
申请日:2008-12-18
Applicant: 富士施乐株式会社
IPC: G06F17/28
Abstract: 基于例句集合的翻译装置、方法和包含翻译装置的短语翻译装置。本发明的短语翻译装置具有:基于词典的翻译方式的基于词典的翻译部;例句完全匹配翻译方式的例句完全匹配翻译部;基于单词对齐例句的翻译方式的基于单词对齐例句的翻译部;基于例句集合的翻译部;基于例句的翻译方式的基于例句的翻译部、基于规则的翻译方式的基于规则的翻译部,输入短语依次分阶段地输入到这些翻译部。基于例句集合的翻译部从例句对译词典选择包含输入短语的多个例句对译组,分别提取多个例句对译组中各例句对译组相互之间的共同部分的组,计算提取出的多个共同部分的组针对输入短语的支持程度,输出基于支持程度选择的共同部分的组中的对译短语作为第2语言译文。
-
公开(公告)号:CN101441623A
公开(公告)日:2009-05-27
申请号:CN200810133952.5
申请日:2008-07-18
Applicant: 富士施乐株式会社
Inventor: 刘绍明
IPC: G06F17/28
CPC classification number: G06F17/2827
Abstract: 一种翻译装置,该翻译装置包括:存储器,用于存储形成例句模式的字符串和形成从该例句模式翻译过来的翻译例句模式的字符串,其中基于形成句子的字符串将例句归类在该例句模式下,形成该例句模式的字符串与形成该翻译例句模式的字符串基于字符串的含义而关联;转换单元,用于将该输入句子转换成这样的句子,该句子包括与由例句共享的公共字符串相对应的公共部分和非公共部分;以及翻译单元,用于根据说明了与形成该翻译例句模式的字符串之间的关联的映射来翻译该输入句子,形成该翻译例句模式的该字符串存储在该存储器中并与对应于转换后的句子的非公共字符部分相关联。
-
公开(公告)号:CN101124579A
公开(公告)日:2008-02-13
申请号:CN200680005581.1
申请日:2006-02-22
Applicant: 富士施乐株式会社
Inventor: 刘绍明
CPC classification number: G06F17/289 , G06F17/2735
Abstract: 本发明公开了单词翻译装置、翻译方法以及翻译程序,该单词翻译装置将第一语言单词检索TRIE结构(100)、第二语言单词检索TRIE结构(200)、第一语言单词信息记录(110)、第二语言单词信息记录(210)存储在双语对照字典中。第一语言单词检索TRIE结构(100)用以检索第一语言的单词。第二语言单词检索TRIE结构(200)用以检索第二语言的单词。第一语言单词信息记录(110)包括识别存储在第一语言单词检索TRIE结构(100)中的各单词的翻译的第一翻译信息。第二语言单词信息记录(210)包括识别存储在第二语言单词检索TRIE结构(200)中的各单词的翻译的第二翻译信息。通过参照第一和第二单词信息记录(110)和(210),能够高精度高速度地在第一和第二语言之间执行单词翻译。
-
公开(公告)号:CN100369046C
公开(公告)日:2008-02-13
申请号:CN200510055415.X
申请日:2005-03-17
Applicant: 富士施乐株式会社
IPC: G06K9/00
CPC classification number: G06K9/6857
Abstract: 文档处理装置和文档处理方法。本发明所提供的文档处理装置包括:一普通特征向量存储器,用于存储多个字符中的每个字符的形状的特征向量;一输入单元,用于光学读入一个文档;一提取单元,用于根据输入单元读入的文档中的字符的形状提取特征向量;一普通形状识别单元,用于根据由提取单元提取的特征向量和存储在普通特征向量存储器中的内容估计其形状的特征向量由所述提取单元提取的字符;和一特殊特征向量存储器,用于与所述普通形状识别单元的估计结果相关联地存储由提取单元提取的特征向量。
-
公开(公告)号:CN101008943A
公开(公告)日:2007-08-01
申请号:CN200610151467.1
申请日:2006-09-08
Applicant: 富士施乐株式会社
IPC: G06F17/28
CPC classification number: G06F17/28
Abstract: 本发明提供了词语对齐设备、例句双语词典、词语对齐方法和词语对齐的程序产品。一种词语对齐设备包括:词语提取部分,用于从例句及其翻译语句中提取各个词语;对齐计算器,用于计算第一语言的词语和第二语言的词语之间的相似度和关联度中的至少一个,以根据计算值,执行分别包括在第一语言的例句中的词语和包括在第二语言的翻译语句中的词语之间的对齐;以及优化部分,用于通过执行二部图匹配来优化所述对齐。
-
公开(公告)号:CN1750018A
公开(公告)日:2006-03-22
申请号:CN200510055925.7
申请日:2005-03-18
Applicant: 富士施乐株式会社
IPC: G06K9/00
CPC classification number: G06F17/271
Abstract: 文档处理装置、文档处理方法和记录相关程序的存储介质。本发明提供了一种文档处理装置,包括:存储器,其存储有语法数据,所述语法数据表示成为文档标题的可能性大的字符串或者成为文档标题的可能性小的字符串的语法;输入单元,其输入通过对文档进行数字化而获得的文档数据;提取单元,其分析输入的文档数据、并提取表示字符串的字符串数据;语法分析单元,其分析所提取的字符串数据、并指定对应于文档数据的文档中包含的各字符串的语法;以及指定单元,其根据语法分析单元的指定结果以及存储在存储器中的内容,从所提取的字符串数据中指定表示与文档数据对应的文档的标题的字符串数据。
-
公开(公告)号:CN1738352A
公开(公告)日:2006-02-22
申请号:CN200510055413.0
申请日:2005-03-17
Applicant: 富士施乐株式会社
CPC classification number: G06K9/00469
Abstract: 文档处理装置、文档处理方法及记录其程序的存储介质。本发明提供的文档处理装置包括:输入单元,用于输入与文档的页面的图像相对应的页面图像数据;提取单元,其分析所述输入单元输入的页面图像数据,确定与该页面图像数据相对应的文档中包含的每个项目的内容,并提取项目数据,所述项目数据是表示所述内容的字符串;产生单元,用于连接由提取单元提取的项目数据并产生名称数据,所述名称数据是表示将被附加于所述文档的名称的字符串;和写入单元,其将所述产生单元产生的名称数据与由输入单元输入的页面图像数据相关联并将所述名称数据和页面图像数据写入存储器。
-
-
-
-
-
-
-
-
-