翻译装置、翻译方法
    1.
    发明公开

    公开(公告)号:CN101923541A

    公开(公告)日:2010-12-22

    申请号:CN201010293753.8

    申请日:2005-08-18

    CPC classification number: G06F17/289 G06K9/00442

    Abstract: 一种翻译装置,包括:字符识别单元,用于识别输入图像文本区中的文本数据;翻译器,用于翻译所述文本区的文本数据;以及布局结构处理器,用于生成包含文本区翻译后文本数据和输入图像中的图形的数据,其中在由所述布局结构处理器生成的数据的图像布局中保持输入图像的布局,布局结构处理器通过改变图形区的大小来生成数据,字符识别单元还对输入图像中的图形区的图像进行字符识别处理,以输出表示图形区字符类型、位置和大小的图形区文本数据;翻译器还对图形区文本数据进行翻译处理,以输出图形区翻译后文本数据,图形区翻译后文本数据表示要容纳入该图形区的字符的类型、位置和大小;所述布局结构处理器包括翻译后数据传送控制器和切换单元。

    文字识别装置、文字识别方法及文字识别程序

    公开(公告)号:CN1752991A

    公开(公告)日:2006-03-29

    申请号:CN200510053566.1

    申请日:2005-03-08

    CPC classification number: G06K9/6835 G06K9/00456

    Abstract: 本发明提供一种可提高混合有活字和手写文字之文件中的手写文字的识别率之文字识别装置、文字识别方法及文字识别程序。利用图像输入部11生成混合有活字和手写文字之文件的输入图像,并将其由双值化部12进行双值化。对双值化图像,利用文件构造解析部14,根据段落和行划分为多数个文章区域而区块化,并对各文章区域分别利用文字分离部15进行1个文字单位的文字分离。而且,利用文件构造解析及文字分离的结果,对每一文章区域利用特征量计算部16计算特征量。特征量统计部统计特征量,并求用于分离活字和手写文字的分离系数。活字手写文字分离部18根据分离系数,对输入图像或文件构造解析部14的输出图像进行活字和手写文字的分离,并分别得到抽出图像。

    文字识别装置、文字识别方法及文字识别程序

    公开(公告)号:CN1752992A

    公开(公告)日:2006-03-29

    申请号:CN200510053567.6

    申请日:2005-03-08

    CPC classification number: G06K9/6835 G06K9/00456

    Abstract: 本发明提供一种可进行混合有铅字和手写文字的文件的电子化之文字识别装置、文字识别方法及文字识别程序。利用图像输入部11,生成混合有铅字和手写文字之原稿的图像,且该图像利用铅字部/手写部分离处理部12,分离为基于前述铅字的铅字部和基于前述手写文字的手写部。利用铅字部OCR处理部13和手写部OCR处理部18对它们分别进行OCR处理,且将铅字OCR的结果在登记词典17中进行登记。利用手写部OCR处理部18之手写部的候补识别为复数个,当存在与其附近的铅字OCR结果一致的铅字时,利用该铅字进行手写部的OCR处理,并将该结果由OCR结果合成处理部21合成为铅字OCR。

    翻译装置、翻译方法
    6.
    发明授权

    公开(公告)号:CN101923541B

    公开(公告)日:2012-05-30

    申请号:CN201010293753.8

    申请日:2005-08-18

    CPC classification number: G06F17/289 G06K9/00442

    Abstract: 一种翻译装置,包括:字符识别单元,用于识别输入图像文本区中的文本数据;翻译器,用于翻译所述文本区的文本数据;以及布局结构处理器,用于生成包含文本区翻译后文本数据和输入图像中的图形的数据,其中在由所述布局结构处理器生成的数据的图像布局中保持输入图像的布局,布局结构处理器通过改变图形区的大小来生成数据,字符识别单元还对输入图像中的图形区的图像进行字符识别处理,以输出表示图形区字符类型、位置和大小的图形区文本数据;翻译器还对图形区文本数据进行翻译处理,以输出图形区翻译后文本数据,图形区翻译后文本数据表示要容纳入该图形区的字符的类型、位置和大小;所述布局结构处理器包括翻译后数据传送控制器和切换单元。

    字符识别装置和字符识别方法

    公开(公告)号:CN1741034A

    公开(公告)日:2006-03-01

    申请号:CN200510055194.6

    申请日:2005-03-16

    CPC classification number: G06K9/2054 G06K2209/01

    Abstract: 字符识别装置和字符识别方法。字符识别装置包括:多个词典数据库,包含归类到各个领域中的术语或字符;确定单元,确定文档图像数据表示的文档的内容所属的领域;选择单元,从所述多个词典数据库中选择与确定单元确定的领域有关的词典数据库;识别单元,通过使用所选词典数据库中存储的术语或字符作为候选,对文档图像数据表示的文档中所写的术语或字符进行识别;以及输出单元,输出识别单元的识别结果。

    图像生成装置及方法
    8.
    发明公开

    公开(公告)号:CN1487476A

    公开(公告)日:2004-04-07

    申请号:CN03120006.0

    申请日:2003-03-10

    CPC classification number: G06F17/217 G06F17/2247

    Abstract: 本发明提供一种分割HTML文本等无页面概念的文本、并生成图像的装置,可以适用于用户的与页面分割相关的多样的需求。页面分割处理部(304),具有对跨越页面间的文本要素可以进行不同处理的多个页面分割算法。用户通过用户交互部(301)输入页面分割策略,则分割算法指定部(305),设定与此策略相对应的页面分割算法,并通知页面处理部(304)。页面分割处理部(304),依此算法将HTML文本进行分割。

    字符识别装置和字符识别方法

    公开(公告)号:CN100351849C

    公开(公告)日:2007-11-28

    申请号:CN200510055194.6

    申请日:2005-03-16

    CPC classification number: G06K9/2054 G06K2209/01

    Abstract: 字符识别装置和字符识别方法。字符识别装置包括:多个词典数据库,包含归类到各个领域中的术语或字符;确定单元,确定文档图像数据表示的文档的内容所属的领域;选择单元,从所述多个词典数据库中选择与确定单元确定的领域有关的词典数据库;识别单元,通过使用所选词典数据库中存储的术语或字符作为候选,对文档图像数据表示的文档中所写的术语或字符进行识别;以及输出单元,输出识别单元的识别结果。

Patent Agency Ranking