一种基于深度学习的文字检测方法及装置

    公开(公告)号:CN105184312B

    公开(公告)日:2018-09-25

    申请号:CN201510522970.2

    申请日:2015-08-24

    Abstract: 本发明公开了一种基于深度学习的文字检测方法及装置。所述方法包括:设计多层卷积神经网络结构,把每一个字符作为一个类别,这样就形成了一个多类别分类问题;采用反向传播算法训练卷积神经网络用以识别单一字符,有监督地最小化该网络的目标函数,得到字符识别模型;最后用前端的特征提取层进行权值初始化,把最后一个全连接层结点数目改为2,使得网络成为一个二分类模型,用文字和非文字样本训练网络。经过以上步骤,一个文字检测分类器就完成了。在测试的时候,把全连接层转化为卷积层,给定一张输入图像,需要先进行多尺度滑动窗口扫描获得文字的概率图,再进行非极大值抑制得到最终的文字区域。

    基于深度学习的文字识别模型训练方法和识别方法

    公开(公告)号:CN105205448B

    公开(公告)日:2019-03-15

    申请号:CN201510522576.9

    申请日:2015-08-24

    Abstract: 一种基于深度学习的文字识别方法,包括:设计更深的多层卷积神经网络结构,把每一个字符作为一个类别;采用反向传播算法训练卷积神经网络用以识别单一字符,有监督地最小化该网络的目标函数,得到字符识别模型;最后根据现有识别出的字符,采用维特比算法从词典中找出最有可能的词语。在测试的时候,给定一个输入,需要先进行滑动窗口扫描获得备选字符,再从备选字符中找出最可能的词语。本方法利用更深的卷积神经网络来学习文字特征,对于文字的颜色、大小、光照、模糊具有鲁棒性,字符识别和词语识别能够保持较高的准确率。

    一种基于深度学习的文字检测方法及装置

    公开(公告)号:CN105184312A

    公开(公告)日:2015-12-23

    申请号:CN201510522970.2

    申请日:2015-08-24

    CPC classification number: G06K9/6256 G06K9/627 G06N3/088

    Abstract: 本发明公开了一种基于深度学习的文字检测方法及装置。所述方法包括:设计多层卷积神经网络结构,把每一个字符作为一个类别,这样就形成了一个多类别分类问题;采用反向传播算法训练卷积神经网络用以识别单一字符,有监督地最小化该网络的目标函数,得到字符识别模型;最后用前端的特征提取层进行权值初始化,把最后一个全连接层结点数目改为2,使得网络成为一个二分类模型,用文字和非文字样本训练网络。经过以上步骤,一个文字检测分类器就完成了。在测试的时候,把全连接层转化为卷积层,给定一张输入图像,需要先进行多尺度滑动窗口扫描获得文字的概率图,再进行非极大值抑制得到最终的文字区域。

    基于深度学习的文字识别模型训练方法和识别方法

    公开(公告)号:CN105205448A

    公开(公告)日:2015-12-30

    申请号:CN201510522576.9

    申请日:2015-08-24

    CPC classification number: G06K9/00536 G06K9/6267 G06K2209/01

    Abstract: 一种基于深度学习的文字识别方法,包括:设计更深的多层卷积神经网络结构,把每一个字符作为一个类别;采用反向传播算法训练卷积神经网络用以识别单一字符,有监督地最小化该网络的目标函数,得到字符识别模型;最后根据现有识别出的字符,采用维特比算法从词典中找出最有可能的词语。在测试的时候,给定一个输入,需要先进行滑动窗口扫描获得备选字符,再从备选字符中找出最可能的词语。本方法利用更深的卷积神经网络来学习文字特征,对于文字的颜色、大小、光照、模糊具有鲁棒性,字符识别和词语识别能够保持较高的准确率。

    识别文档方向的方法、系统和神经网络

    公开(公告)号:CN108345827B

    公开(公告)日:2021-11-30

    申请号:CN201710060219.4

    申请日:2017-01-24

    Inventor: 王若辰 范伟 孙俊

    Abstract: 本发明公开了一种识别文档方向的方法、系统和神经网络。该方法包括:提取文档中的文本行;计算文本行为正向的第一正向结果和为反向的第一反向结果;计算旋转180度后的文本行为正向的第二正向结果和为反向的第二反向结果;以及根据第一正向结果和第一反向结果以及第二正向结果和第二反向结果确定文档的方向。

    一种对神经网络模型进行训练的方法、装置及电子设备

    公开(公告)号:CN108140144B

    公开(公告)日:2021-06-01

    申请号:CN201680061886.8

    申请日:2016-03-31

    Abstract: 一种对神经网络模型进行训练的方法、装置和电子设备。该方法包括:提取神经网络模型的一部分,以形成神经网络子模型;对所述神经网络子模型进行训练,以形成优化的神经网络子模型;根据所述优化的神经网络子模型中的各权值,初始化所述神经网络模型中的各权值,以形成初始化神经网络模型,并且,所述初始化神经网络模型与所述优化的神经网络子模型具有相同的输出特性;基于已知训练集,对所述初始化神经网络模型中的各权值进行调整。根据该方法,能够缩短大规模神经网络的训练时间并避免过拟合问题。

    图像视角变换装置以及方法

    公开(公告)号:CN107845068B

    公开(公告)日:2021-05-11

    申请号:CN201610829031.7

    申请日:2016-09-18

    Inventor: 刘威 范伟 孙俊

    Abstract: 本发明实施例提供一种图像视角变换装置以及方法。所述图像视角变换方法包括:基于文档图像的灰度图抽取多条直线并按照水平方向和垂直方向分类;基于所述文档图像的二值图抽取多条文本行线并按照水平方向和垂直方向分类;从抽取和分类后的直线以及文本行线中选择出两条垂直线和两条水平线;基于选择出的两条垂直线和两条水平线所形成的方框计算变换矩阵;以及使用该变换矩阵对文档图像进行变换以获得视角变换后的图像。由此,即使拍摄到的文档图像不完整,也能准确地获得透视变换矩阵,从而能够更好地进行图像视角变换。

    图像处理装置及方法
    8.
    发明授权

    公开(公告)号:CN106940877B

    公开(公告)日:2021-04-20

    申请号:CN201610007111.4

    申请日:2016-01-05

    Abstract: 本发明提供了图像处理装置和图像处理方法。图像处理装置包括:纹理调整单元,被配置成对拼接在一起的第一图像和第二图像的重叠区域中的前景像素和背景像素进行纹理调整处理,使得第一图像与第二图像之间由于拼接而产生的重叠区域中的纹理是渐变的。纹理调整单元包括确定模块。确定模块用于确定重叠区域中的像素的经过纹理调整的像素值,并且被配置成:针对前景像素,基于对第一图像的像素插值所获得的相对应像素的像素值来确定所述前景像素的经过纹理调整的像素值;针对背景像素,基于对第一图像的像素插值所获得的相对应像素的像素值和第二图像的相对应像素的像素值的加权组合,来确定所述背景像素的经过纹理调整的像素值。

    图像处理方法、图像处理设备及图像处理装置

    公开(公告)号:CN107305683B

    公开(公告)日:2021-01-12

    申请号:CN201610256932.1

    申请日:2016-04-22

    Inventor: 范伟 刘威 孙俊

    Abstract: 本公开提供一种用于图像拼接的图像处理方法、图像处理设备和图像处理装置,该图像处理方法包括:获取待拼接图像的图像序列,并且针对图像序列中的每帧图像,提取该图像中的特征点并获取特征点的分布;基于特征点的分布对图像序列中的各帧图像进行排列,并且基于特征点的分布从排列后的各帧图像形成多个图像拼接组,其中每个图像拼接组中包括图像序列中的多帧图像;以及针对每个图像拼接组中的第一帧图像,基于特征点的分布选择最优拼接图像以及最优拼接区域,从而基于各个最优拼接图像和最优拼接区域形成与所述待拼接图像对应的拼接图像。根据本公开的图像处理方法、设备和装置能够提高拼接图像的质量。

    处理图像的装置和方法
    10.
    发明授权

    公开(公告)号:CN106557526B

    公开(公告)日:2020-06-30

    申请号:CN201510640999.0

    申请日:2015-09-30

    Abstract: 本公开涉及一种处理图像的装置和方法。在一个实施方式中该装置包括:定位模块,其被配置为定位第一图像和第二图像的特征点;特征描述子提取模块,其被配置为提取表征第一图像和第二图像的每个特征点的特征描述子;分类模块,其被配置为根据分类特征集的所有特征,确定第一图像和第二图像的每个特征点的特征点分类;以及相似度计算模块,其被配置为基于第一图像和第二图像的每个特征点的特征点分类,使用相似度计算特征集的所有特征计算第一图像和第二图像之间的相似度。该装置和方法能够快速、准确地检索出与查询图相似的图像。

Patent Agency Ranking