确定输入图像中的表单的类别的方法和装置

    公开(公告)号:CN102750514A

    公开(公告)日:2012-10-24

    申请号:CN201110104698.8

    申请日:2011-04-20

    Abstract: 本发明公开了确定输入图像中的表单的类别的方法和装置。所述方法包括:根据输入图像中的表单的线条信息来确定候选类别列表;如果所述候选类别列表不为空,则进一步根据预打印内容来确定输入图像中的表单的类别;如果所述候选类别列表为空,则确定所述输入图像中的表单为新类别。因而,可以以简单高效地方式来自动地确定表单的类别,并可以在表格结构相同的表单中进行区分。

    彩色文档图像的分层方法和装置

    公开(公告)号:CN101520845B

    公开(公告)日:2011-11-30

    申请号:CN200810081557.7

    申请日:2008-02-29

    Abstract: 提供了一种彩色文档图像的分层装置和方法。本发明的彩色文档图像分层装置执行如下处理:确定所述文档图像的背景色;将所述文档图像中的每个像素点映射到以所述背景色为原点的RGB空间中,构建反映了所述文档图像的像素点在所述RGB空间中的分布的特征平面;基于所述特征平面中的密度分布将所述特征平面分割为一个以上的区域;基于所述分割结果,将所述文档图像划分为一个以上的图层。

    文档处理装置、方法以及确定文档图像的朝向的设备

    公开(公告)号:CN105335372B

    公开(公告)日:2019-01-22

    申请号:CN201410261004.5

    申请日:2014-06-12

    Abstract: 本公开提供了文档处理装置、方法以及确定文档图像的朝向的设备。文档处理装置包括:提取装置,用于从文档图像中提取出至少一个文本行;置信度获取装置,用于根据由所述提取装置提供的文本行的结构特征,获取所述文本行的、与第一类文本相关的置信度,所述置信度表示所述第一类文本相对于第二类文本的重要性程度;以及排序装置,用于至少根据所述置信度,对所述至少一个文本行中包含的文本的质量进行排序。

    文档图像的校正装置、方法以及扫描仪

    公开(公告)号:CN104657730B

    公开(公告)日:2018-01-05

    申请号:CN201310589148.9

    申请日:2013-11-20

    Inventor: 谢术富 何源 孙俊

    Abstract: 本发明实施例提供一种文档图像的校正装置、方法以及扫描仪,其中,该装置包括:提取文档图像的沿第一方向的边界以及根据文档图像的内容提取沿第一方向的线条的提取单元、对提取的线条进行过滤的过滤单元、对过滤后的线条进行延长和调整并构建校正网格的构建单元以及利用该校正网格进行校正的校正单元。通过在构建校正模型时同时考虑了文档边界以及文档内容,并且,在对提取的线条进行过滤、延长和调整后构建校正网格,从而能够构建出准确的校正模型,有效的消除了文档图像中的畸变。

    文本提取方法和装置
    25.
    发明授权

    公开(公告)号:CN104732188B

    公开(公告)日:2017-12-08

    申请号:CN201310705512.3

    申请日:2013-12-19

    Abstract: 本发明涉及一种文本提取方法和装置。一种文本提取方法,包括:获取用户对图像上感兴趣的文本的指定;确定文本的大小;确定文本的排列方向;估计文本的排列方向的偏移角度;根据文本的大小、排列方向和偏移角度来确定包含文本的图像片段;对图像片段中的种子连通部件进行种子连通部件生长以提取用户感兴趣的文本。

    图像处理装置和图像处理方法

    公开(公告)号:CN103795943B

    公开(公告)日:2017-05-17

    申请号:CN201210431709.8

    申请日:2012-11-01

    Abstract: 本公开提供一种用于去除图像中的闪烁噪声的图像处理装置和图像处理方法。该图像处理装置包括:划分单元,用于将像素值域划分为至少两个区间;噪声去除单元,用于针对图像中像素值分别落入至少两个区间的像素进行不同平滑程度的滤波,以去除图像中的闪烁噪声,其中,噪声去除单元对落入具有较高像素值的区间中的像素进行平滑程度较高的滤波,并对落入具有较低像素值的区间中的像素进行平滑程度较低的滤波。

    挖掘图片中的主题关键词的方法和设备

    公开(公告)号:CN103544186B

    公开(公告)日:2017-03-01

    申请号:CN201210246688.2

    申请日:2012-07-16

    Abstract: 本发明涉及一种挖掘图片中的主题关键词的方法和设备。挖掘图片中的主题关键词的方法包括:初始检索词识别步骤,识别图片中的关键词作为初始的检索词;候选关键词提取步骤,利用检索词检索与图片相关的主题网页以从中提取候选关键词;检索词选择步骤,根据候选关键词和搜索候选关键词所用的检索词之间的链接关系,从候选关键词中选择一部分候选关键词作为下次的候选关键词提取步骤所用的检索词;以及重复候选关键词提取步骤和检索词选择步骤直到满足预定条件。

    图像处理装置和图像处理方法

    公开(公告)号:CN103793892B

    公开(公告)日:2016-10-05

    申请号:CN201210430646.4

    申请日:2012-11-01

    Abstract: 本公开提供一种图像处理装置和图像处理方法。该图像处理装置用于去除图像中的闪烁噪声,其包括:直方图生成单元,用于生成图像的每一行的直方图;像素填补单元,用于向每一行的直方图中的特定小区填补预定数量的像素,其中该每一行具有一个或更多个像素的高度;累积直方图生成单元,用于基于每一行的经过像素填补的直方图生成每一行的累积直方图,作为原始累积直方图;噪声去除单元,用于利用原始累积直方图对图像中的闪烁噪声进行去除。本公开的方案在不提高系统计算量和运行成本的情况下,仅通过对单幅图像进行处理可以高效地执行闪烁噪声的去除。

    基于子结构学习的手写中文识别方法

    公开(公告)号:CN103324929B

    公开(公告)日:2016-05-18

    申请号:CN201310255159.3

    申请日:2013-06-25

    Inventor: 朱远平 何源 孙俊

    Abstract: 本发明公开了一种基于子结构学习的手写中文识别方法,将字符分割片段视为汉字的子结构,从汉字分割片段样本中提取汉字子结构模式,并将汉字子结构模式纳入汉字分类器训练中,最后结合子结构识别信息和汉字子结构组成信息实现手写中文字符串的识别。本发明基于汉字是由一个或多个子结构组成的这一特点,通过提取汉字子结构,并在汉字分类器中将汉字子结构和汉字单字同时进行训练,能有效提高手写中文字符串识别过程中字符分割片段的识别可靠性,减少由于不可靠的字符分割片段识别导致手写中文字符串的识别错误,提高手写汉字识别精度。

Patent Agency Ranking