-
公开(公告)号:CN101021905A
公开(公告)日:2007-08-22
申请号:CN200610003579.2
申请日:2006-02-15
Applicant: 中国科学院自动化研究所
IPC: G06K9/38
Abstract: 本发明涉及图像处理与模式识别学技术领域,特别是一种文档图像的二值化方法。针对现有图像二值化技术处理低质量文档图像的能力不足,提出了一种新的文档图像二值化方法,首先对图像进行前背景像素初始标定,在此基础上分析笔划邻域信息,包括灰度信息、梯度信息和几何信息,然后,基于笔划邻域信息对文字笔划进行图像增强,最后在增强后的图像上进行二值化。同时,本发明还提出了一种快速前背景像素标定方法和一种改进的基于Niblack方法的二值化阈值求取方法,用于上述的二值化方法中。
-
公开(公告)号:CN111611933B
公开(公告)日:2023-07-14
申请号:CN202010441086.7
申请日:2020-05-22
Applicant: 中国科学院自动化研究所
IPC: G06V30/40 , G06V30/148 , G06V30/19 , G06V10/80 , G06N3/08 , G06N3/0464 , G06V10/82
Abstract: 本发明涉及一种文档图像的信息提取方法及系统,所述提取方法包括:基于全卷积神经网络,根据待识别文档图像,得到字符感知响应图;采用分水岭算法,对字符感知响应图进行分割,得到多个分割图像;通过连通域提取方法,对各分割图像进行字符提取,得到各分割图像中的字符;基于深度神经网络的字符识别模型,对各字符进行识别,确定各字符的位置信息;根据位置信息,对字符进行合并,得到待识别图像的识别信息。本发明通过全卷积神经网络、分水岭算法、连通域提取方法,确定待识别文档图像的各分割图像中的字符,并基于深度神经网络的字符识别模型,确定各字符的位置信息;进而根据位置信息对字符进行合并,可准确得到待识别图像的识别信息。
-
公开(公告)号:CN110084117A
公开(公告)日:2019-08-02
申请号:CN201910223004.9
申请日:2019-03-22
Applicant: 中国科学院自动化研究所
Abstract: 本发明属于文本图像识别技术领域,具体涉及一种基于二值图分段投影的文档表格线检测方法、系统,旨在为了解决解决文档图像图像质量不稳定带来的表格线识别的准确度和鲁棒性不足的问题。本发明方法包括:输入图像的二值化处理;沿水平方向切分等宽等长的矩形子图,并计算各像素行投影值;获取各子图中表示表格线段的矩形框;基于所有子图,获取表格线候选路径;依据长度信息选择表格线候选路径对应的矩形框得到第一表格线集合,对第一图像旋转后经上述方法得到表格线,你旋转后得到第二表格线集合。本发明且不会受到具体表格类型的影响,具有较好的通用性,且对文档图像图像质量不稳定情况下进行表格线识别,提高了识别准确度和鲁棒性。
-
公开(公告)号:CN104318214B
公开(公告)日:2017-09-15
申请号:CN201410583963.9
申请日:2014-10-27
Applicant: 中国科学院自动化研究所
Abstract: 本发明是一种基于结构化词典域转移的交叉视角人脸识别方法,其包括步骤:S1:将训练出每个对样本类别有区分性的子词典串接构成结构化的源域词典;S2:学习目标域和多个中间域词典;S3:对源域及目标域的图像人脸编码、源域词典、目标域词典和多个中间域词典计算,得到并分别将源域及目标域人脸图像的源域重构图像、目标域重构图像和中间域重构图像串接组成源域人脸图像的域共享特征和目标域人脸图像的域共享特征;S4:根据源域人脸图像的域共享特征,对源域人脸集中的每一类样本训练一个支持向量机模型;将目标域人脸图像的域共享特征输入所有类别的支持向量机模型,取得分数最高的支持向量机模型对应的类别定义为目标域人脸图像的类别。
-
公开(公告)号:CN103218609B
公开(公告)日:2016-01-20
申请号:CN201310148805.6
申请日:2013-04-25
Applicant: 中国科学院自动化研究所
IPC: G06K9/00
Abstract: 本发明公开了一种基于隐最小二乘回归的自适应多姿态人脸识别方法。该方法包含一种基于隐最小二乘回归的多姿态人脸识别方法,其包括:检测输入的人脸图像的区域大小及位置;对检测到的人脸图像进行校正,得到校正后的人脸图像;从校正后的人脸图像中提取人脸面部的特征值;根据所提取的人脸面部的特征值估计校正后的人脸图像的姿态类别;根据所述姿态类别选择与其对应的变换矩阵以及偏移向量,并根据所述变换矩阵、偏移向量和提取的特征值计算得到该人脸图像的身份特征向量;从已知人脸图像检索库中搜索与所输入的人脸图像的身份特征向量相似度最高的已知人脸图像,并返回该已知人脸图像的身份信息作为识别结果。
-
公开(公告)号:CN103035001B
公开(公告)日:2015-06-24
申请号:CN201210520167.1
申请日:2012-12-06
Applicant: 中国科学院自动化研究所
IPC: G06T7/00
Abstract: 本发明公开了一种基于超像素分割的地基云自动检测方法,该方法包括:利用超像素分割算法将输入的RGB云图分割为多个超像素块;根据各颜色通道的图像,得到特征图像;计算每一超像素块的局部阈值;利用双线性插值算法得到阈值矩阵;比较阈值矩阵与特征图像得到每个像素点的判断结果;利用判断结果以及像素点之间的位置对应关系,得到输入的RGB云图的云检测结果。本发明方法能够尽可能地保持超像素块中的一致性,获得更好的云检测结果,从而具有较好的鲁棒性和准确性。
-
公开(公告)号:CN102156885B
公开(公告)日:2014-03-26
申请号:CN201010112508.2
申请日:2010-02-12
Applicant: 中国科学院自动化研究所
IPC: G06K9/66
Abstract: 本发明为一种基于级联式码本生成的图像分类方法,该方法采用级联式的码本生成方式,根据训练样本的变化,动态地调整样本映射空间,使得训练样本更容易被分开,进而训练基于当前码本的分类器。测试图像依次通过训练好的每一个分类器,如果所有分类器输出为正,图像类别标签判别为正,否则,图像类别标签判别为负。该方法采用级联式的码本生成方法,使得每一轮的码本在保持较强的判别性的同时,降低了图像表示的维数,解决了码本多样性与维数灾难之间的矛盾;同时,本方法采用级联式的码本生成方式,使得每一轮训练正负样本数目相同,巧妙的解决了特定类别分类中常见的样本不均衡问题,具有重要的应用价值。
-
公开(公告)号:CN103413148A
公开(公告)日:2013-11-27
申请号:CN201310389346.0
申请日:2013-08-30
Applicant: 中国科学院自动化研究所
IPC: G06K9/62
Abstract: 本发明公开了一种基于随机自适应符号稀疏编码的地基云图分类方法,该方法包括:对于训练样本集合随机提取样本的局部特征;利用自适应符号稀疏编码对这些局部特征组成的集合进行聚类得到码本;对每个样本随机提取的局部特征,计算其与码本对应的稀疏编码系数,得到该样本随机局部特征的稀疏编码系数组成的矩阵;接下来利用最大化抽取操作得到样本的特征表示;计算测试地基云图的特征表示;利用分类器得到测试地基云图的分类结果。本发明通过随机提取地基云图的局部特征来提高地基云图分类的效率,节省时间开销;同时本发明采用自适应符号稀疏编码的方法来获得码本并计算局部特征的稀疏编码系数,从而可以更好地表示云图中信息,提高分类性能。
-
公开(公告)号:CN103336961A
公开(公告)日:2013-10-02
申请号:CN201310308807.7
申请日:2013-07-22
Applicant: 中国科学院自动化研究所
Abstract: 本发明公开了一种交互式自然场景文本检测方法,该方法首先在场景图片中标记出感兴趣文本所在区域,即在文本上画一条线;根据这条线从原图中选取一个扩展区域,在扩展区域中进行边缘检测,对边缘检测结果进行连通域标记,再对标记结果的边界进行投影得到边缘文本区域;然后对这个区域分块二值化、连通域标记和投影操作,得到粗略文本区域;最后对粗略文本区域进行分块二值化和反色的二值化操作,对两种二值化结果分别进行连通域标记、去除各种噪声、边界投影和连通域数目确定,根据两种二值图像的连通域数目确定图片极性,再对连通域进行融合得到精确的文本区域。本方法具有局部空间自适应性,对自然场景图片中背景复杂的文本块有很好的检测效果。
-
公开(公告)号:CN103218609A
公开(公告)日:2013-07-24
申请号:CN201310148805.6
申请日:2013-04-25
Applicant: 中国科学院自动化研究所
IPC: G06K9/00
Abstract: 本发明公开了一种基于隐最小二乘回归的自适应多姿态人脸识别方法。该方法包含一种基于隐最小二乘回归的多姿态人脸识别方法,其包括:检测输入的人脸图像的区域大小及位置;对检测到的人脸图像进行校正,得到校正后的人脸图像;从校正后的人脸图像中提取人脸面部的特征值;根据所提取的人脸面部的特征值估计校正后的人脸图像的姿态类别;根据所述姿态类别选择与其对应的变换矩阵以及偏移向量,并根据所述变换矩阵、偏移向量和提取的特征值计算得到该人脸图像的身份特征向量;从已知人脸图像检索库中搜索与所输入的人脸图像的身份特征向量相似度最高的已知人脸图像,并返回该已知人脸图像的身份信息作为识别结果。
-
-
-
-
-
-
-
-
-