文档图像的检索装置及文档图像的检索方法

    公开(公告)号:CN101276363A

    公开(公告)日:2008-10-01

    申请号:CN200710090670.7

    申请日:2007-03-30

    CPC classification number: G06K9/4604 G06K9/00456 G06K2209/01

    Abstract: 本发明提供一种可提高以文字和图表为主要内容的文档图像的检索精度的文档图像的检索装置及检索方法。本发明的文档图像的检索装置在图像的特征区段的信息中包含有用于图像彼此之间的识别中的特征矢量。具体地讲,将文档图像页中的文字部分连结,而抽出矩形图像,基于该矩形图像的信息,分析页的几何构造,并将文档图像页分割成多个区段,且从其中选择表现文档图像页的特征的多个特征区段,由所选择的这些特征区段的信息构成特征矢量。

    文档图像处理装置以及文档图像处理方法

    公开(公告)号:CN101226595A

    公开(公告)日:2008-07-23

    申请号:CN200710000960.8

    申请日:2007-01-15

    CPC classification number: G06K9/6828 G06F17/30253

    Abstract: 本发明的文档图像处理装置,抽取出文档图像中的标题区域的图像,将其按单个文字进行分割,并抽出各文字图像的图像特征,基于该图像特征,从以单个文字为单位储存有文字图像的图像特征的字形特征字典中,按照匹配度从高到低的顺序,选择出N个文字图像作为候补文字,其中N为N>1的整数,并制作成抽取出的文字列的文字数M×N维索引矩阵。然后,基于所制作出的索引矩阵,制作出反映了文档图像内容的有意义的文档名,并对所存储的文档图像进行管理。由此,可以提供一种不用麻烦用户的手,就可自动制作反映了文档图像内容的有意义的文档名并进行管理的文档图像处理装置及方法。

    笔画结构输入方法和系统
    33.
    发明公开

    公开(公告)号:CN102346558A

    公开(公告)日:2012-02-08

    申请号:CN201010240335.2

    申请日:2010-07-26

    CPC classification number: G06F17/242 G06F3/018

    Abstract: 本发明提出了一种笔画结构输入系统和笔画结构输入方法,用于输入中文、日文、韩文等具有笔画和结构的文字。根据本发明的笔画结构输入系统包括:文字笔画结构字典、词组笔画结构字典、输入收集单元、笔画结构到文字转换单元、笔画结构到词组转换单元、候选选择单元,其中将结构信息用作多个文字间的分隔符,提高了输入的效率。此外,本发明的笔画结构输入系统还可以包括预测字典和预测单元,能够提供预测功能。此外,本发明的笔画结构输入系统还可以包括笔顺无关单元,即使用户输入错误的笔画顺序,也能够找到所需的文字。

    图像辨别装置及图像检索装置

    公开(公告)号:CN101551859B

    公开(公告)日:2012-01-04

    申请号:CN200810090406.8

    申请日:2008-03-31

    Abstract: 本发明提供一种图像辨别装置及图像检索装置。预处理部(120)对所输入的图像数据进行2值化,算出整体黑像素比例。在特征抽出部(121)中,检索2值图像数据中所包含的连通区域,并检索外接于该连通区域的外接矩形。对于所检测到的外接矩形,基于外接矩形的大小和矩形黑像素比例,从全部的连通区域中去除规定的连通区域。使用去除了不需要的结合像素之后的剩余的连通区域,来生成以外接矩形的大小为级别、以连通区域数为次数的柱状图。辨别部(122),基于与所生成的柱状图相关联的信息、和上述整体黑像素比例,来辨别所输入的图像数据是文档图像数据还是非文档图像数据。

    字形特征字典制作装置及具备该装置的文档图像处理装置

    公开(公告)号:CN101354704B

    公开(公告)日:2011-01-12

    申请号:CN200710129607.X

    申请日:2007-07-23

    CPC classification number: G06F17/30253 G06K9/723 G06K2209/01 G06K2209/011

    Abstract: 本发明提供一种字形特征字典制作装置和具备该装置的文档图像处理装置,其中,抽取出文档图像中的文字数为M个的文字列的图像,并将其分割成单个文字而抽出各文字图像的图像特征,基于该图像特征,从将文字图像的图像特征以单个文字为单位储存着的字形特征字典(15)中,按匹配度从高到低的顺序,选择出N个文字图像作为候补文字,其中N为N>1的整数,制作所抽取出的文字列的文字数M×N维的第1索引矩阵。对于由构成该第1索引矩阵的第1列的两个或两个以上候补文字构成的候补文字列,适用基于预定的语言模型的词汇解析,制作将候补文字列调整成有意义的文字列的第2索引矩阵,并用于检索中。由此,可使检索精度进一步提高。

    手写识别方法和设备
    36.
    发明公开

    公开(公告)号:CN101930545A

    公开(公告)日:2010-12-29

    申请号:CN200910146369.2

    申请日:2009-06-24

    Abstract: 本发明公开了一种手写识别方法和设备,能够对用户连续手写输入的字符序列进行识别,为用户提供方便。该方法包括以下步骤:计算输入字符序列的各种特征,包括它的各种笔画组合的单字识别正确度特征和空间几何特征;采用概率模型,来计算各种切分方式中的各个笔画组合的切分可信度,概率模型中的各项系数,通过对已有样本的训练,采用参数估计方法来估计;在进行笔画组合的单字识别时,采用多模板匹配的方法来识别多种不同写法的字符;搜索出最佳的切分路径;进行后处理,对识别结果进行优化。本发明的方法和设备具有结构简单、硬件要求低、识别速度快,识别率高等优点,可在嵌入式系统等上实现。

    文档图像处理装置和文档图像处理方法

    公开(公告)号:CN101354703B

    公开(公告)日:2010-11-17

    申请号:CN200710129606.5

    申请日:2007-07-23

    CPC classification number: G06F17/30253 G06K9/723 G06K2209/01 G06K2209/011

    Abstract: 本发明提供一种文档图像处理装置及文档图像处理方法。其中,抽取出文档图像中的文字数为M的文字列的图像,将其以1个文字为单位进行分割,并抽出各文字图像的图像特征,基于该图像特征,从以单个文字为单位储存有文字图像的图像特征的字形特征字典(15)中,按照匹配度从高到低的顺序选择N(N>1的整数)个文字图像作为候补文字,而制作抽取出的文字列的文字数为M×N维的第1索引矩阵。并且,对于由构成该第1索引矩阵的第1列的两个或两个以上候补文字构成的候补文字列,通过适用基于预定的语言模型的词汇解析,来制作出调整成有意义的文字列的第2索引矩阵,并在语言模型的基础上统计后进行词汇解析。

    信息设备及其控制方法和系统

    公开(公告)号:CN101807111A

    公开(公告)日:2010-08-18

    申请号:CN200910007425.4

    申请日:2009-02-13

    Abstract: 提出了一种信息设备及其控制方法和系统。它基于对象检测和跟踪。利用该方法,摄像头所拍摄的现场视频被自动分析。检测出在视频中的特定对象。跟踪该对象并且记录该对象的运动轨迹。根据获得的轨迹,计算机能够确定用户是否已经发出了一些信号和发出哪些信号。在此之后,这些确定的信号被变换成适合目标系统的命令来执行。这样,用户能够通过挥动特定的对象来实现非接触系统控制。

    检测语音关键词的方法和设备及检索方法和系统

    公开(公告)号:CN101593519A

    公开(公告)日:2009-12-02

    申请号:CN200810099976.3

    申请日:2008-05-29

    Abstract: 公开了一种检测语音关键词的方法和设备以及相应的检索方法和系统,该设备包括:VQ码本库,存储了基于预定声学模型的VQ码本;状态特征库,存储了该语音文件的VQ状态序列矩阵,该矩阵包括该语音文件的各个语音帧的VQ码本编号和相应的声学概率值;状态序列生成单元,基于VQ码本库中的VQ码本,将输入的关键词转换成相应的VQ状态序列;以及匹配单元,利用转换的VQ状态序列对状态特征库中的VQ状态序列矩阵进行缩减,并用该VQ状态序列在经缩减的矩阵中搜索该语音关键词。利用本发明的技术,能够从音频文件中快速检测到语音关键词,以及从音频文件库中快速找到含有该关键词的音频文件。

    图像检索装置及图像检索方法

    公开(公告)号:CN101488129A

    公开(公告)日:2009-07-22

    申请号:CN200810000707.7

    申请日:2008-01-14

    CPC classification number: G06K9/4647

    Abstract: 本发明提供一种图像检索装置及图像检索方法。若在灰度处理部(11)中转换成灰度图像数据,则直方图生成部(12)生成表示上述灰度图像数据的像素数分布的直方图。基于关注像素的浓淡度和以大致圆周状地包围关注像素的多个周边像素的浓淡度,针对各像素计算出旋转不变的特征量,并基于所计算出的特征量生成直方图,其中该旋转不变的特征量表示以关注像素为中心的局部的纹理特征。检索部(15),基于登记图像数据的直方图和输入图像数据的直方图,检索相似的图像数据,显示部(16)显示检索结果。

Patent Agency Ranking