-
公开(公告)号:CN1459761A
公开(公告)日:2003-12-03
申请号:CN02117865.8
申请日:2002-05-24
Applicant: 清华大学
CPC classification number: G06K9/4609 , G06K2209/01
Abstract: 基于Gabor滤波器组的字符识别方法属于字符图像识别技术领域,其特征在于:在训练系统中依次含有以下步骤:用Gabor滤波器组抽取字符图像中各个方向的笔画,用平均熵相关系数求最优的滤波器参数;对Gabor滤波器组的输出结果作非线性后处理,以进一步增加识别系统对图像亮度、对比度变化以及图像干扰的抵抗能力;对Gabor滤波器组的输出中的正值和负值分别用高斯滤波器阵列计算识别特征,并合成为一个高维的特征矢量;用线性鉴别分析法降低特征矢量的维数,以增强识别性能,降低分类器的复杂度和计算量。该方法与具体的语种无关,成功的解决了低质量图像中的字符识别问题,对于印刷体和脱机手写汉字获得了目前最高的识别率。对身份证的总体识别率到达了90%以上,已经符合实用的要求。
-
公开(公告)号:CN1437162A
公开(公告)日:2003-08-20
申请号:CN03119130.4
申请日:2003-03-14
Applicant: 清华大学
Abstract: 基于单个汉字字符的字体识别方法属于汉字字体识别领域。其特征在于,它是一种利用小波变换的与文本无关的字体识别方法。它根据选定的层数J,用相应的尺度函数和小波函数的离散滤波器对离散信息作卷积处理,对原始图像进行J层小波变换,得到3J+1个子图像;再把各个子图像划分为子块,以每个子块中小波系数绝对值的加权和作为特征,经过整形处理后,得到原始图像的小波特征。然后再利用线性鉴别分析从小波特征中提取字体识别特征,最后用高斯模型的二次分类器进行训练和识别。本发明的平均识别率可达97.35%。
-
公开(公告)号:CN112926372A
公开(公告)日:2021-06-08
申请号:CN202010853196.4
申请日:2020-08-22
Abstract: 本发明公开一种基于序列变形的场景文字检测方法及系统。所述方法及系统包括:特征提取模块基于卷积神经网络对输入的场景图像提取第一特征图x,并发送至序列变形模块;序列变形模块通过对第一特征图x进行迭代采样,得到采样位置对应的特征图,并且通过将第一特征图x与采样得到的特征图沿通道维度进行深度学习中的拼接操作而得到第二特征图m,并发送至辅助字符计数网络;序列变形模块还通过对第二特征图m的通道维度上进行特征聚合操作而得到第三特征图,并发送至目标检测基准网络;目标检测基准网络通过对第三特征图进行文本区域候选框提取,并通过回归拟合得到文本区域预测结果作为场景文字检测结果。
-
公开(公告)号:CN112215223A
公开(公告)日:2021-01-12
申请号:CN202011107999.1
申请日:2020-10-16
Abstract: 本发明公开了一种基于多元注意力机制的多方向场景文字识别方法及系统,所述方法包括:由特征提取器对从外接的文字检测模块输出的文本行/列图像I进行归一化处理,利用深层卷积神经网络对经归一化的图像提取特征,得到原始特征图F0,在原始特征图F0上叠加二维方向位置编码P输出多通道特征图F;由编码器将从特征提取器输出的多通道特征图F转换为隐含表示H;由解码器将从编码器输出的隐含表示H转换为识别文本作为输出结果。本发明提供的多方向场景文字识别方法及系统,适用于识别场景图像中的横排、竖排多种方向以及弯曲文本行,具有较强的适用性。
-
公开(公告)号:CN104008370A
公开(公告)日:2014-08-27
申请号:CN201410211494.8
申请日:2014-05-19
Applicant: 清华大学
Abstract: 本发明公开了一种视频人脸识别方法,包括以下步骤:S1:对视频进行人脸检测和跟踪得到人脸序列;S2:对所述人脸序列进行筛选,得到人脸典型帧集合;S3:基于正面人脸生成技术和图像超分辨率技术优化所述人脸典型帧集合,得到增强的人脸典型帧集合;S4:通过将所述增强的人脸典型帧集合与预设的静态人脸图像匹配库比对,进行人脸识别或验证。与现有的视频人脸识别方法相比,本发明通过使用增强的人脸典型帧集合,过滤和补偿了视频人脸姿态和分辨率的变化,从而提高了视频人脸识别的鲁棒性。
-
公开(公告)号:CN101452532B
公开(公告)日:2010-09-08
申请号:CN200810240092.5
申请日:2008-12-18
Applicant: 清华大学
Abstract: 本发明公开了一种文本无关笔迹鉴别的方法和装置,属于计算机视觉领域。所述方法包括:对查询笔迹样本进行预处理,得到查询笔迹样本边缘图像;从查询笔迹样本边缘图像中提取查询笔迹样本网格微结构特征;计算查询笔迹样本网格微结构特征与每个参考笔迹样本网格微结构特征在不同维度上的标准差;通过加权标准差,计算查询笔迹样本网格微结构特征与每个参考笔迹样本网格微结构特征的特征间距离;对特征间距离进行比较排序,获得查询笔迹样本书写者候选列表。所述装置包括:预处理模块、特征提取模块、权值计算模块、距离计算模块、比较模块。本发明通过比较网格微结构特征间距离获取书写候选人,提高了笔迹鉴别的正确率和鉴别性能。
-
公开(公告)号:CN101452532A
公开(公告)日:2009-06-10
申请号:CN200810240092.5
申请日:2008-12-18
Applicant: 清华大学
Abstract: 本发明公开了一种文本无关笔迹鉴别的方法和装置,属于计算机视觉领域。所述方法包括:对查询笔迹样本进行预处理,得到查询笔迹样本边缘图像;从查询笔迹样本边缘图像中提取查询笔迹样本网格微结构特征;计算查询笔迹样本网格微结构特征与每个参考笔迹样本网格微结构特征在不同维度上的标准差;通过加权标准差,计算查询笔迹样本网格微结构特征与每个参考笔迹样本网格微结构特征的特征间距离;对特征间距离进行比较排序,获得查询笔迹样本书写者候选列表。所述装置包括:预处理模块、特征提取模块、权值计算模块、距离计算模块、比较模块。本发明通过比较网格微结构特征间距离获取书写候选人,提高了笔迹鉴别的正确率和鉴别性能。
-
公开(公告)号:CN101159015A
公开(公告)日:2008-04-09
申请号:CN200710177020.6
申请日:2007-11-08
Applicant: 清华大学
Abstract: 本发明公开了一种二维人脸图像识别的方法,属于模式识别和计算机视觉领域。所述方法包括:根据已知三维人脸数据库,建立三维人脸形变模型;输入二维人脸图像进行注册,利用三维人脸形变模型,对注册后的二维人脸图像进行三维重建,得到对所述注册的二维人脸图像的三维重建结果;通过建立光照模型,从所述三维重建结果中生成姿态、光照变化的虚图像;利用所述虚图像进行变化限制分类器设计;输入待识别的二维人脸图像,进行特征提取和压缩处理,然后将所述抽取和压缩处理后的特征输入到所述变化限制分类器中,输出分类结果,最后实现了对人脸图像的识别。通过采用本发明的方法,实现了识别过程完全自动化,提高了识别准确率,识别速度也有很大改善。
-
公开(公告)号:CN100347723C
公开(公告)日:2007-11-07
申请号:CN200510012195.2
申请日:2005-07-15
Applicant: 清华大学
IPC: G06K9/62
Abstract: 几何代价和语义-识别代价融合的脱机手写汉字切分方法,属于文字识别领域,其特征在于,首先通过对输入的脱机手写汉字的行图像进行分析,提取出笔段,将笔段合并成子字符块,同时给出子字符块合并的几何代价,由这些几何代价生成若干可能的候选切分方法,对每个方法用语言的二元语法模型进行评价,得到每种切分方式的语义-识别代价,最后综合几何与语义-识别代价给出最优的切分识别方案。本发明应用于手写信封地址的切分与识别上,其切分正确率可以达到93%,大大改进了传统切分方法的性能,对于其他语言文字或领域的切分问题也有一定的指导作用。
-
公开(公告)号:CN1794266A
公开(公告)日:2006-06-28
申请号:CN200510136310.7
申请日:2005-12-31
Applicant: 清华大学
IPC: G06K9/00
Abstract: 本发明属于分类器集成和模式识别领域,其特征在于,首先通过各种采集设备获得用户的人脸、虹膜、在线签名和脱机笔迹各生物特征,接下来将这些生物特征分别送入对应的识别认证子模块进行特征提取和模板匹配,并输出各自匹配后得到的分数。这些分数经过归一化后,或者被送入识别融合模块,通过置信度集成等步骤得到最后的识别结果;或者被送入认证融合模块,映射到多维空间并通过分类器分类后得到最后的认证结果;或者识别融合之后再次进行认证融合,得到认证后的最终识别结果。经过融合以后,无论是进行验证还是识别,总的错误率较之单一生物特征识别认证系统,都得到了降低。
-
-
-
-
-
-
-
-
-