基于生成对抗网络的文档图像二值化方法、系统、装置

    公开(公告)号:CN110097059A

    公开(公告)日:2019-08-06

    申请号:CN201910222323.8

    申请日:2019-03-22

    Abstract: 本发明属于图像处理领域,具体涉及一种基于生成对抗网络的文档图像二值化方法、系统、装置,旨在为了解决解决现有二值化方法在文档图片的图像质量参差不齐的情况下其二值化准确度不稳定,鲁棒性较差的问题。本发明方法包括:对原始文档图像进行切分;分基于第一卷积神经网络分别对切分图像、归一化后的原始文档图像进行二值化处理;将得到的二值化图像分别通过拼接、缩放生成原始文档图像尺寸,并与原始文档图像的灰度图进行合并,进行图片切分后通过第二卷积神经网络进二值化,并合并得到的二值化图像块得到最终的二值化图。本发明对于多种类型文档的拍照文档图像可以获取准确度较高的二值化图像,且具有较高的稳定性,鲁棒性强。

    基于笔画结构对称性的文档图像二值化方法

    公开(公告)号:CN106203434B

    公开(公告)日:2019-07-19

    申请号:CN201610534712.0

    申请日:2016-07-08

    Abstract: 本发明公开了一种基于笔画结构对称性的文档图像二值化方法。其中,所述方法包括:确定文档图像的梯度图像,其中,所述文档图像为灰度图像;利用最大类间方差法,对所述梯度图像进行全局二值化处理;根据文字笔画的宽度和局部区域内梯度方向对称性,去除全局二值化处理后图像中的非笔画梯度噪声,确定局部梯度方向对称的梯度图像;基于所述局部梯度方向对称的梯度图像,确定结构对称元素图像;根据所述结构对称元素图像中前景元素的局部密度,滤除噪声,并结合所述文档图像进行基于投票策略的局部二值化。通过本发明实施例解决了如何增强对文档图像文字提取的适应性的技术问题。

    一种基于鉴别性笔画库的英文场景文字识别方法

    公开(公告)号:CN104573663B

    公开(公告)日:2017-12-05

    申请号:CN201510023529.X

    申请日:2015-01-16

    Abstract: 本发明是一种基于鉴别性笔画库的英文场景文字识别方法,其包括步骤:1、基于关键点标注的笔画子检测器学习;2、笔画子检测器响应区域的界定;3、鉴别性笔画选取;4、特征提取和文字分类器的训练。本发明参考物体库的思路,通过标记的关键点来为笔画子检测器收集训练样本,并且为每一个文字笔画子检测器设定特定的响应区域,既可以减轻特征抽取的计算负担,又增强了文字分类器的鉴别能力。

    一种基于域自适应的英文场景文字识别方法

    公开(公告)号:CN104537362B

    公开(公告)日:2017-12-01

    申请号:CN201510022065.0

    申请日:2015-01-16

    Abstract: 本发明是一种基于域自适应的英文场景文字识别方法,其包括步骤:1、建立位置嵌入词典;2)基于位置嵌入词典的编码和抽取;3)中间域词典的学习;4)文字分类器的训练和测试。本发明方法先通过建立位置嵌入词典解决传统图像金字塔无法应用于场景文字识别的问题,之后通过非监督词典学习方法对训练域和目标域的分布差异进行内插,从而实现域自适应的英文场景文字识别。

    一种零训练样本行为识别方法

    公开(公告)号:CN103400160B

    公开(公告)日:2017-03-01

    申请号:CN201310364990.2

    申请日:2013-08-20

    Abstract: 本发明公开了一种零训练样本行为识别方法,该方法包括以下步骤:提取每个动作视频样本的特征向量;设定多个人体运动属性以及每个人体运动属性下动作视频对之间的关系;将动作视频对关系作为输入,利用排序支持向量机进行训练;利用输出的排序分数,对每一类有训练样本的人体行为拟合得到混合高斯模型;利用迁移学习获得零训练样本人体行为类别的混合高斯模型;提取测试视频样本的特征向量;利用最大后验概率原则,判断测试视频样本中零训练样本人体行为所属的类别。本发明通过利用混合高斯模型拟合排序分数,达到行为识别的目的,并通过最大后验判断所属类别,从而提高行为识别的鲁棒性。

    基于笔画结构对称性的文档图像二值化方法

    公开(公告)号:CN106203434A

    公开(公告)日:2016-12-07

    申请号:CN201610534712.0

    申请日:2016-07-08

    CPC classification number: G06K9/38 G06K9/40

    Abstract: 本发明公开了一种基于笔画结构对称性的文档图像二值化方法。其中,所述方法包括:确定文档图像的梯度图像,其中,所述文档图像为灰度图像;利用最大类间方差法,对所述梯度图像进行全局二值化处理;根据文字笔画的宽度和局部区域内梯度方向对称性,去除全局二值化处理后图像中的非笔画梯度噪声,确定局部梯度方向对称的梯度图像;基于所述局部梯度方向对称的梯度图像,确定结构对称元素图像;根据所述结构对称元素图像中前景元素的局部密度,滤除噪声,并结合所述文档图像进行基于投票策略的局部二值化。通过本发明实施例解决了如何增强对文档图像文字提取的适应性的技术问题。

    一种基于完备化局部三值模式的地基云图分类方法

    公开(公告)号:CN103336972A

    公开(公告)日:2013-10-02

    申请号:CN201310314199.0

    申请日:2013-07-24

    Abstract: 本发明公开了一种基于完备化局部三值模式的地基云图分类方法,该方法包括以下步骤:将每个训练样本的局部信息分解为局部差值向量以及中心像素;将每个局部差值向量分解为符号向量和幅值向量的乘积;对于符号向量、幅值向量及中心像素采用三值模式编码,并分别计算其旋转不变一致性特征;对旋转不变一致性特征进行融合,得到训练样本的最终特征表示;计算测试地基云图的最终特征表示;基于两者的最终特征表示,应用最近邻分类器得到测试地基云图的分类结果。本发明通过把图像的局部信息从符号、幅值和中心像素值三个方面考虑,采用局部三值模式进行编码,最后融合得到图像最终的特征表示,这使得本发明可以获得更好的噪声鲁棒性和分类准确性。

    一种多视角行为识别方法
    38.
    发明公开

    公开(公告)号:CN103226713A

    公开(公告)日:2013-07-31

    申请号:CN201310181275.5

    申请日:2013-05-16

    Abstract: 本发明公开了一种多视角行为识别方法。该方法包括以下步骤:对每个视角的动作视频样本提取其局部和全局特征,并把每个动作视频样本表示成为一个特征向量;对源视角和目标视角的动作视频样本的变换矩阵进行初始化;然后在信息论的框架下求得源视角和目标视角的动作视频样本的变换矩阵;根据两个视角的动作视频样本的变换矩阵求得虚拟视角核;然后求得每个动作视频样本之间的相似度;最后使用支持向量机分类器对测试动作视频进行分类。本发明通过连接在源视角和目标视角的连续通路达到多视角行为识别的目的;通过虚拟视角核计算得到的相似度矩阵能够作为任何基于核分类器的输入。

    基于短语包模型的图像类别标注方法

    公开(公告)号:CN101894264B

    公开(公告)日:2012-11-14

    申请号:CN201010195097.8

    申请日:2010-05-31

    Abstract: 本发明为一种基于短语包模型的图像类别标注方法,该方法在现有的字包模型表示的基础上,引入视觉字之间的位置信息,提出了短语包模型表示策略。本发明有效的解决了传统字包模型缺乏位置信息导致判别性不足与加入分块的位置信息后对目标位移敏感之间的矛盾;使得图像在引入视觉字之间的位置信息而增加了判别性的同时,消除了对目标在图像中位移的敏感性,有效地提高了图像类别标注系统的性能,具有重要的应用价值。

    基于类别相关的码本和分类器投票策略的图像分类方法

    公开(公告)号:CN102156871A

    公开(公告)日:2011-08-17

    申请号:CN201010112518.6

    申请日:2010-02-12

    Abstract: 本发明为基于类别相关的码本和分类器投票策略的图像分类方法,首先图像数据集预处理模块将图像表示为局部显著区域图像块的集合;类别相关的码本生成模块生成类别相关的码本;图像向量化模块根据类别相关的码本,将图像表示为图像向量,类别相关分类器训练模块选择其中的训练图像向量和训练图像对应的类别标签训练任意两个类别之间的分类器;最后,基于分类器投票策略的测试图像分类模块根据各个分类器的投票结果,确定测试图像的类别标签。类别相关码本生成模块有效地解决了码本过大导致维数灾难与码本过小判别性不足的矛盾;同时类别相关的分类器训练模块也摆脱了多类别分类中样本不均衡产生的问题,提高了分类性能。

Patent Agency Ranking