文档处理装置、文档处理方法以及扫描仪

    公开(公告)号:CN103455806B

    公开(公告)日:2017-06-13

    申请号:CN201210177541.2

    申请日:2012-05-31

    CPC classification number: G06K9/18 G06K9/00442 G06K9/3208 G06K2209/01

    Abstract: 本公开提供了一种文档处理设备和设备以及扫描仪。该文档处理装置包括:文本行提取单元,其从所输入的文档中提取文本行;语言分类单元,其确定所输入的文档的语言是否需要进行OCR处理;OCR单元,其在确定需要进行OCR时,通过进行OCR处理来确定OCR置信度;图形特征识别单元,其确定图形特征识别置信度;以及确定单元,其基于图形特征识别置信度以及OCR置信度中的至少一项来确定组合置信度,并且基于组合置信度来确定所输入的文档的朝向。根据本公开的技术方案,可以更好地判断文档的朝向,尤其适合于在文档的图像质量退化时判断文档的朝向。

    用于图像识别的神经网络的训练方法和装置

    公开(公告)号:CN106485192A

    公开(公告)日:2017-03-08

    申请号:CN201510556368.0

    申请日:2015-09-02

    Abstract: 本发明涉及用于图像识别的神经网络的训练方法和装置。该方法包括:将样本图像表示为高维空间中的点集,高维空间的大小为样本图像的空间域的大小×样本图像的强度域的大小;生成大小与高维空间的大小相同的第一随机扰动矩阵;对第一随机扰动矩阵进行平滑;用平滑后的第一随机扰动矩阵对高维空间中的点集进行扰动得到扰动后的点集;以及将扰动后的点集作为新的样本来训练神经网络。根据本发明,改进了传统的卷积神经网络的分类性能,产生更多的训练样本,减轻过拟合的影响,增强了卷积神经网络的泛化性能。

    图像拼接方法和图像拼接设备

    公开(公告)号:CN106296577A

    公开(公告)日:2017-01-04

    申请号:CN201510257323.3

    申请日:2015-05-19

    Abstract: 公开了一种图像拼接方法和图像拼接设备。该图像拼接方法包括:对第一图像和第二图像进行粗对准,以得到两者的矩形重叠区域;将重叠区域的左下角与右上角之间的对角线的左侧部分作为第一图像的第一拼缝的左侧部分,并基于第一拼缝的左侧部分在第二图像中估计第二拼缝的左侧部分;将重叠区域的对角线的右侧部分作为第二图像的第二拼缝的右侧部分,并基于第二拼缝的右侧部分在第一图像中估计第一拼缝的右侧部分;基于第一拼缝和第二拼缝对重叠区域执行局部平滑变换;将第一图像和第二图像的非重叠区域与变换后的重叠区域进行组合,从而形成第一图像和第二图像的拼接图像。根据本公开的实施例,能够去除局部错误对准并且不需多次变换图像。

    神经网络系统及该神经网络系统的训练方法

    公开(公告)号:CN105844331A

    公开(公告)日:2016-08-10

    申请号:CN201510020691.6

    申请日:2015-01-15

    Abstract: 本发明涉及一种神经网络系统及该神经网络系统的训练方法。该神经网络系统包括:输入层;隐含层;以及每个隐含层之后的输出层,其中,输出层包括分类器和重构器。本发明的神经网络系统能够同时优化分类误差和重构误差,从而更好地从一个数据集中学习特征并更完整地提取该数据集的信息,以用于辅助训练另一个相似的数据集上的神经网络系统。

    收据图像处理方法和设备
    145.
    发明授权

    公开(公告)号:CN102968610B

    公开(公告)日:2016-03-30

    申请号:CN201110270388.3

    申请日:2011-08-31

    Abstract: 本申请提供一种收据图像处理方法和设备,该方法包括:根据特征信息检测收据图像中表示金额的金额数字,其中特征信息包括金额在收据图像中的位置信息和/或金额本身的符号特征信息;根据金额数字来识别收据图像中包含金额数字的特征行;以及基于特征行的位置分布,分别将收据图像中的各个文本行分组到若干重复块中,其中若干重复块彼此之间相似。

    图像中文本区域定位方法和装置

    公开(公告)号:CN102855478B

    公开(公告)日:2015-11-25

    申请号:CN201110192175.3

    申请日:2011-06-30

    Abstract: 本发明公开了一种图像中文本区域定位方法和装置。根据本发明的图像中文本区域定位方法包括:估计输入图像中每个像素周围可能存在的文本大小;根据所述文本大小和区域差异度从所述输入图像中提取候选笔划区域;从所述候选笔划区域中确定真实笔划区域;以及合并所述真实笔划区域以形成文本区域。

    图像处理方法和设备
    148.
    发明授权

    公开(公告)号:CN102375990B

    公开(公告)日:2015-03-04

    申请号:CN201010257628.1

    申请日:2010-08-17

    Abstract: 提供了图像处理方法和设备。在一种图像处理方法中,在包括从样本图像中提取的多个图像块的图像块集合中,搜索每个图像块的一个或更多个近邻图像块,其中,所述一个或更多个近邻图像块包括所述图像块集合中距离该每个图像块最近的一个或更多个图像块,并形成该每个图像块的近邻集。然后,保存所述图像块集合以及有关每个图像块的近邻集的信息。

    一种视频去抖动方法和视频去抖动装置

    公开(公告)号:CN102348046B

    公开(公告)日:2014-08-27

    申请号:CN201010244375.4

    申请日:2010-07-30

    Abstract: 本发明公开了一种视频去抖动方法和装置。所述视频去抖动方法包括:为原始视频中的每个帧生成用于将该帧变换成去除了抖动的帧的变换矩阵;确定所述原始视频的裁剪尺寸;以及利用所述原始视频中的每个帧的变换矩阵、所述裁剪尺寸以及所述原始视频的分辨率对所述原始视频中的每个帧进行包括变换、裁剪和扩展的图像合成。

    图标识别方法和装置
    150.
    发明授权

    公开(公告)号:CN102129562B

    公开(公告)日:2014-07-09

    申请号:CN201010004433.6

    申请日:2010-01-15

    Abstract: 本发明公开了一种图标识别方法和装置。该方法包括:获取待识别图像的前景边缘密度特征;以及分类步骤,根据所述前景边缘密度特征对所述待识别图像是否为图标进行分类。获取待识别图像的前景边缘密度特征的步骤包括下述两步骤:获取整个待识别图像的前景边缘密度作为第一前景边缘密度特征;和获取待识别图像的前景边缘密度的离散程度作为第二前景边缘密度特征。分类步骤被配置为根据所述第一前景边缘密度特征和所述第二前景边缘密度特征对所述待识别图像是否为图标进行分类。相应的图标识别装置能够实现该方法。

Patent Agency Ranking