文档图像处理装置及文档图像处理方法

    公开(公告)号:CN101493896B

    公开(公告)日:2013-02-06

    申请号:CN200810000249.7

    申请日:2008-01-24

    Abstract: 抽取出文档图像中字符数为M的字符串,将其1个字符1个字符地分割,抽出各字符图像的图像特征,根据该图像特征,利用以1个字符为单位储存字符图像的图像特征的字形特征字典15,按照匹配度从高到低的顺序选择N个(N>1的整数)字符图像作为候选字符,创建抽取出的字符串的字符数M×N维的第1索引矩阵。从创建的第1索引矩阵作成字符组合,根据基于概念词典的意义解析,抽出主题词。抽出的主题词按照基于规定的权重信息、统计信息决定的顺序进行一览显示。

    文档图像处理装置和文档图像处理方法

    公开(公告)号:CN101354705B

    公开(公告)日:2012-06-13

    申请号:CN200710129608.4

    申请日:2007-07-23

    CPC classification number: G06F17/30253 G06F17/30017

    Abstract: 本发明提供一种可减少从文档图像中检索出所希望的标题所需的时间和劳力的文档图像处理装置。其中,由标题区域抽出部(301)检索索引信息DB(17),并抽出包含检索关键词的标题区域。顺序设定部(302)对由标题区域抽出部(301)抽出的标题区域,按照预定的规则来自动地设定顺序。显示部(303)中,显示文档图像,而且在所显示的文档图像上,按照由顺序设定部(302)设定的顺序,来强调显示由标题区域抽出部(301)抽出的标题区域。也可以基于抽出的标题关键词的个数及文字图像的特征来判断重要性,并设定所显示的检索结果的顺序。

    图像辨别装置及图像检索装置

    公开(公告)号:CN101567048B

    公开(公告)日:2012-06-06

    申请号:CN200810090491.8

    申请日:2008-04-21

    CPC classification number: G06K9/54 G06K9/346 G06K9/522

    Abstract: 本发明提供能够降低辨别处理所需的运算量且能够提高辨别精度的图像辨别装置及具备该装置的图像检索装置。其中,预处理部(120)对所输入的图像数据进行二值化并算出全体黑像素比例。在特征抽出部(121)中,检测出二值图像数据中包含的连通区域,检测出外接于该连通区域的外接矩形。对检测出的外接矩形,基于外接矩形的大小及所包含的黑像素数,从所有连通区域中去除规定的连通区域。辨别部(122)利用剩余的连通区域生成边缘图,并进行二维快速傅立叶变换而生成频谱数据。另一方面,也对模板图像进行二维快速傅立叶变换而生成频谱数据,并基于这些频谱数据来辨别输入图像数据中是否包含圆形状。

    摘要生成装置和摘要生成方法

    公开(公告)号:CN102479196A

    公开(公告)日:2012-05-30

    申请号:CN201010560580.1

    申请日:2010-11-23

    Inventor: 乐宁 吴波 吴亚栋

    Abstract: 本发明目的是提供摘要生成装置和摘要生成方法,通过考虑具有多个词义的单词而能够生成适当的摘要。在摘要生成装置(100)中设有:存储文章数据的文章数据存储部(10);对由文章数据表示的文章中的多个单词,基于该文章数据统计各单词的词频,当文章中的单词具有多个词义时,按照每个词义作为不同的副单词处理,统计与各副单词对应的词频的词频统计部(20);基于文章数据和表示文章中的单词和副单词中词频最高者的数据来选择文章中的多个句子,从而生成摘要数据的句子选择部(30)。

    信息处理装置、信息处理系统和信息处理方法

    公开(公告)号:CN101276412A

    公开(公告)日:2008-10-01

    申请号:CN200710090671.1

    申请日:2007-03-30

    CPC classification number: G06K9/033 G06K9/00456

    Abstract: 一种信息处理装置具有:特征抽出部,其从印刷有具有记入栏的多个项目的处理对象文件的图像数据中,作为样式信息抽出处理对象文件的样式的特征;表识别部,其将处理对象文件的样式信息,与存储在存储装置中的关于多个登记文件的样式的特征即样式信息进行比较,并特定与处理对象文件相对应的登记文件;数据取得部,其将处理对象文件的图像数据中的文字转换成文本数据;数据分割部,其将处理对象文件的各个项目中的记入栏的文字的图像数据和文本数据,根据每个登记文件的分割规则,按每个项目分成多个组,并将每个这些组发送给不同的作业用终端装置。由此,在处理个人信息等保护对象信息时,可防止使用保护对象信息的作业人员以完整的状态获得保护对象信息。

    手写字符切分方法和电子设备

    公开(公告)号:CN103513898A

    公开(公告)日:2014-01-15

    申请号:CN201210206379.2

    申请日:2012-06-21

    Abstract: 本发明公开了一种手写字符切分方法和电子设备。该方法包括步骤:接收并显示手写输入笔划,产生容纳所述手写输入笔划的外部矩形,定义为“字符外框”;将所述“字符外框”叠加显示在所述手写输入笔划外面;接收后续的手写输入笔划,当后续的手写输入笔划的全部轨迹都落在所述“字符外框”的外面时,将该后续的手写输入笔划之前的“字符外框”中的所有笔划切分为独立的字符。利用上述方案中“字符外框”的设计,把字符串识别转化为单个字符识别,而不需要进行字符切分的分析,因此极大提高了手写字符串识别的正确率。

    字典制作方法、手写输入方法和设备

    公开(公告)号:CN101354749B

    公开(公告)日:2013-01-09

    申请号:CN200710130196.6

    申请日:2007-07-24

    Inventor: 沈利 吴波 吴亚栋

    Abstract: 公开了一种制作字典的方法、手写输入方法和设备。该制作字典的方法能够够预测笔划要输入的文字,以便减轻使用者的负担。该方法包括步骤:提取文字的整字样本的整字特征,和笔划数大于预定值的文字的部分笔划样本的部分笔划特征;以及通过用机器学习算法对所述整字特征和所述部分笔划特征进行学习来生成文字的整字模板和/或部分笔划模板,作为字典中的项目。本系统具有结构简单、硬件要求低、识别速度快,识别率高等优点,可在嵌入式系统等上实现。

    文档图像处理装置以及文档图像处理方法

    公开(公告)号:CN101226595B

    公开(公告)日:2012-05-23

    申请号:CN200710000960.8

    申请日:2007-01-15

    CPC classification number: G06K9/6828 G06F17/30253

    Abstract: 本发明的文档图像处理装置,抽取出文档图像中的标题区域的图像,将其按单个文字进行分割,并抽出各文字图像的图像特征,基于该图像特征,从以单个文字为单位储存有文字图像的图像特征的字形特征字典中,按照匹配度从高到低的顺序,选择出N个文字图像作为候补文字,其中N为N>1的整数,并制作成抽取出的文字列的文字数M×N维索引矩阵。然后,基于所制作出的索引矩阵,制作出反映了文档图像内容的有意义的文档名,并对所存储的文档图像进行管理。由此,可以提供一种不用麻烦用户的手,就可自动制作反映了文档图像内容的有意义的文档名并进行管理的文档图像处理装置及方法。

    文档图像处理装置及文档图像处理方法

    公开(公告)号:CN101493896A

    公开(公告)日:2009-07-29

    申请号:CN200810000249.7

    申请日:2008-01-24

    Abstract: 抽取出文档图像中字符数为M的字符串,将其1个字符1个字符地分割,抽出各字符图像的图像特征,根据该图像特征,利用以1个字符为单位储存字符图像的图像特征的字形特征字典15,按照匹配度从高到低的顺序选择N个(N>1的整数)字符图像作为候选字符,创建抽取出的字符串的字符数M×N维的第1索引矩阵。从创建的第1索引矩阵作成字符组合,根据基于概念词典的意义解析,抽出主题词。抽出的主题词按照基于规定的权重信息、统计信息决定的顺序进行一览显示。

Patent Agency Ranking