-
公开(公告)号:CN101923541A
公开(公告)日:2010-12-22
申请号:CN201010293753.8
申请日:2005-08-18
Applicant: 富士施乐株式会社
Inventor: 小山俊哉 , 斋藤照花 , 馆野昌一 , 田中圭 , 长尾隆 , 榊原正义 , 彭新宇 , 中村浩太郎 , 伊藤笃 , 田川昌俊 , 田宗道弘 , 增市博 , 佐藤直子 , 田代洁
IPC: G06F17/28
CPC classification number: G06F17/289 , G06K9/00442
Abstract: 一种翻译装置,包括:字符识别单元,用于识别输入图像文本区中的文本数据;翻译器,用于翻译所述文本区的文本数据;以及布局结构处理器,用于生成包含文本区翻译后文本数据和输入图像中的图形的数据,其中在由所述布局结构处理器生成的数据的图像布局中保持输入图像的布局,布局结构处理器通过改变图形区的大小来生成数据,字符识别单元还对输入图像中的图形区的图像进行字符识别处理,以输出表示图形区字符类型、位置和大小的图形区文本数据;翻译器还对图形区文本数据进行翻译处理,以输出图形区翻译后文本数据,图形区翻译后文本数据表示要容纳入该图形区的字符的类型、位置和大小;所述布局结构处理器包括翻译后数据传送控制器和切换单元。
-
公开(公告)号:CN1752991A
公开(公告)日:2006-03-29
申请号:CN200510053566.1
申请日:2005-03-08
Applicant: 富士施乐株式会社
CPC classification number: G06K9/6835 , G06K9/00456
Abstract: 本发明提供一种可提高混合有活字和手写文字之文件中的手写文字的识别率之文字识别装置、文字识别方法及文字识别程序。利用图像输入部11生成混合有活字和手写文字之文件的输入图像,并将其由双值化部12进行双值化。对双值化图像,利用文件构造解析部14,根据段落和行划分为多数个文章区域而区块化,并对各文章区域分别利用文字分离部15进行1个文字单位的文字分离。而且,利用文件构造解析及文字分离的结果,对每一文章区域利用特征量计算部16计算特征量。特征量统计部统计特征量,并求用于分离活字和手写文字的分离系数。活字手写文字分离部18根据分离系数,对输入图像或文件构造解析部14的输出图像进行活字和手写文字的分离,并分别得到抽出图像。
-
公开(公告)号:CN1487477A
公开(公告)日:2004-04-07
申请号:CN03120010.9
申请日:2003-03-10
Applicant: 富士施乐株式会社
CPC classification number: G06F3/1205 , G06F3/1212 , G06F3/1246 , G06F3/125 , G06F3/1265 , G06F3/1287 , G06F3/1292
Abstract: 本发明提供一种图像形成装置,该装置用于印刷结合了从参照目标地取得的内容数据的页,加速印刷输出。文件分析部(33)分析印刷对象文件,需从参照目标取得内容数据的文件要素以暂定的尺寸布置,内容数据的描绘尺寸已知的文件要素,以该尺寸布置,来进行暂定的分页。文件管理部(45)监视内容数据的取得状况,在检测所有应布置到开头页中的内容数据取得完成时刻,指示描绘部(34)描绘输出该页。
-
公开(公告)号:CN1752992A
公开(公告)日:2006-03-29
申请号:CN200510053567.6
申请日:2005-03-08
Applicant: 富士施乐株式会社
CPC classification number: G06K9/6835 , G06K9/00456
Abstract: 本发明提供一种可进行混合有铅字和手写文字的文件的电子化之文字识别装置、文字识别方法及文字识别程序。利用图像输入部11,生成混合有铅字和手写文字之原稿的图像,且该图像利用铅字部/手写部分离处理部12,分离为基于前述铅字的铅字部和基于前述手写文字的手写部。利用铅字部OCR处理部13和手写部OCR处理部18对它们分别进行OCR处理,且将铅字OCR的结果在登记词典17中进行登记。利用手写部OCR处理部18之手写部的候补识别为复数个,当存在与其附近的铅字OCR结果一致的铅字时,利用该铅字进行手写部的OCR处理,并将该结果由OCR结果合成处理部21合成为铅字OCR。
-
公开(公告)号:CN1838112B
公开(公告)日:2012-05-30
申请号:CN200510092818.1
申请日:2005-08-18
Applicant: 富士施乐株式会社
Inventor: 小山俊哉 , 斋藤照花 , 馆野昌一 , 田中圭 , 长尾隆 , 榊原正义 , 彭新宇 , 中村浩太郎 , 伊藤笃 , 田川昌俊 , 田宗道弘 , 增市博 , 佐藤直子 , 田代洁
IPC: G06F17/28
Abstract: 一种翻译装置,包括:字符识别单元,用于识别输入图像文本区中的文本数据;翻译器,用于翻译所述文本区的文本数据;以及布局结构处理器,用于生成包含文本区翻译后文本数据和输入图像中的图形的数据,其中在由所述布局结构处理器生成的数据的图像布局中保持输入图像的布局。
-
公开(公告)号:CN101923541B
公开(公告)日:2012-05-30
申请号:CN201010293753.8
申请日:2005-08-18
Applicant: 富士施乐株式会社
Inventor: 小山俊哉 , 斋藤照花 , 馆野昌一 , 田中圭 , 长尾隆 , 榊原正义 , 彭新宇 , 中村浩太郎 , 伊藤笃 , 田川昌俊 , 田宗道弘 , 增市博 , 佐藤直子 , 田代洁
IPC: G06F17/28
CPC classification number: G06F17/289 , G06K9/00442
Abstract: 一种翻译装置,包括:字符识别单元,用于识别输入图像文本区中的文本数据;翻译器,用于翻译所述文本区的文本数据;以及布局结构处理器,用于生成包含文本区翻译后文本数据和输入图像中的图形的数据,其中在由所述布局结构处理器生成的数据的图像布局中保持输入图像的布局,布局结构处理器通过改变图形区的大小来生成数据,字符识别单元还对输入图像中的图形区的图像进行字符识别处理,以输出表示图形区字符类型、位置和大小的图形区文本数据;翻译器还对图形区文本数据进行翻译处理,以输出图形区翻译后文本数据,图形区翻译后文本数据表示要容纳入该图形区的字符的类型、位置和大小;所述布局结构处理器包括翻译后数据传送控制器和切换单元。
-
公开(公告)号:CN1741034A
公开(公告)日:2006-03-01
申请号:CN200510055194.6
申请日:2005-03-16
Applicant: 富士施乐株式会社
IPC: G06K9/00
CPC classification number: G06K9/2054 , G06K2209/01
Abstract: 字符识别装置和字符识别方法。字符识别装置包括:多个词典数据库,包含归类到各个领域中的术语或字符;确定单元,确定文档图像数据表示的文档的内容所属的领域;选择单元,从所述多个词典数据库中选择与确定单元确定的领域有关的词典数据库;识别单元,通过使用所选词典数据库中存储的术语或字符作为候选,对文档图像数据表示的文档中所写的术语或字符进行识别;以及输出单元,输出识别单元的识别结果。
-
公开(公告)号:CN1487476A
公开(公告)日:2004-04-07
申请号:CN03120006.0
申请日:2003-03-10
Applicant: 富士施乐株式会社
CPC classification number: G06F17/217 , G06F17/2247
Abstract: 本发明提供一种分割HTML文本等无页面概念的文本、并生成图像的装置,可以适用于用户的与页面分割相关的多样的需求。页面分割处理部(304),具有对跨越页面间的文本要素可以进行不同处理的多个页面分割算法。用户通过用户交互部(301)输入页面分割策略,则分割算法指定部(305),设定与此策略相对应的页面分割算法,并通知页面处理部(304)。页面分割处理部(304),依此算法将HTML文本进行分割。
-
公开(公告)号:CN100454293C
公开(公告)日:2009-01-21
申请号:CN200510098630.8
申请日:2005-09-05
Applicant: 富士施乐株式会社
IPC: G06F17/24
CPC classification number: G06F17/241
Abstract: 文档编辑方法和文档编辑设备。所述文档编辑设备具有编辑单元和附加信息编辑单元。该编辑单元编辑文档的原稿要素;该附加信息编辑单元基于该编辑单元对原稿要素的编辑结果,编辑文档的附加信息。所述文档是由读取设备读取的电子文档。
-
公开(公告)号:CN100351849C
公开(公告)日:2007-11-28
申请号:CN200510055194.6
申请日:2005-03-16
Applicant: 富士施乐株式会社
IPC: G06K9/00
CPC classification number: G06K9/2054 , G06K2209/01
Abstract: 字符识别装置和字符识别方法。字符识别装置包括:多个词典数据库,包含归类到各个领域中的术语或字符;确定单元,确定文档图像数据表示的文档的内容所属的领域;选择单元,从所述多个词典数据库中选择与确定单元确定的领域有关的词典数据库;识别单元,通过使用所选词典数据库中存储的术语或字符作为候选,对文档图像数据表示的文档中所写的术语或字符进行识别;以及输出单元,输出识别单元的识别结果。
-
-
-
-
-
-
-
-
-