字符识别方法和装置
    21.
    发明授权

    公开(公告)号:CN1308889C

    公开(公告)日:2007-04-04

    申请号:CN200310118685.1

    申请日:2003-11-28

    Inventor: 李献 胡欧

    Abstract: 本发明涉及字符识别方法、装置和存储介质。其中,将两个不同的分类器集成起来,第二分类器使用第一分类器的中间分类结果,从而提高识别率。也可以使用强噪声过滤器。比较强降噪之前和之后的识别率,以获得较好的结果作为最终结果,从而使高质量和低质量的字符图像的识别率都提高。

    用于跟踪视频序列中的对象的装置和方法以及存储介质

    公开(公告)号:CN110298863B

    公开(公告)日:2023-06-13

    申请号:CN201810237391.7

    申请日:2018-03-22

    Abstract: 本公开涉及用于跟踪视频序列中的对象的装置和方法以及存储介质。对象跟踪装置可以包括:第一预测单元,被配置成对于当前视频帧,基于当前视频帧和一个或多个先前视频帧的使用第一跟踪模板跟踪对象的第一部位的结果来预测第一部位在后续视频帧中是否可见;第一更新单元,被配置成在第一预测单元预测第一部位在后续视频帧中不可见的情况下,基于当前视频帧中的对象的第二部位的图像来更新用于跟踪第二部位的第二跟踪模板;以及切换单元,被配置成对于后续视频帧,将跟踪方式从使用第一跟踪模板跟踪第一部位切换到使用更新后的第二跟踪模板跟踪第二部位。

    图像处理装置及图像处理方法

    公开(公告)号:CN106709404B

    公开(公告)日:2022-01-04

    申请号:CN201510784143.0

    申请日:2015-11-16

    Abstract: 本发明的一个方面公开了一种图像处理装置及图像处理方法。所述图像处理装置包括:图像获取单元,其被构造为获取包含面部的图像;区域定位单元,其被构造为在获取到的图像中,定位代表所述面部的属性的至少一个区域;特征提取单元,其被构造为从定位的区域中提取特征;以及特征整合单元,其被构造为对基于所述面部的对称性而彼此对称的定位的区域的特征进行整合。根据本发明,能够减少用于图像处理的特征的维数,并且能够尽可能地维持图像处理精度。

    用于识别脸部表情的装置和方法、图像处理装置和系统

    公开(公告)号:CN108021847B

    公开(公告)日:2021-09-14

    申请号:CN201610951434.9

    申请日:2016-11-02

    Abstract: 本发明提供一种用于识别脸部表情的装置和方法、图像处理装置和系统。一种用于识别图像的脸部区域中的脸部的表情的装置包括:被构造为检测图像的脸部区域中的脸部的特征点的单元;被构造为基于检测到的特征点来确定脸部区域中的脸部的脸部形状的单元;被构造为基于确定的脸部形状和预先定义的形状组来确定脸部区域中的脸部所属的组的单元;以及被构造为基于与确定的组对应的预先生成的第一模型和从脸部区域中的至少一个区域提取的特征来确定脸部区域中的脸部的表情的单元,其中,所述至少一个区域是在与确定的组对应的预先生成的第一模型中标记出的区域。根据本发明,将提高脸部表情识别的准确度。

    用于确定词间距的方法和设备以及用于分词的方法和系统

    公开(公告)号:CN106156772B

    公开(公告)日:2019-08-02

    申请号:CN201510132285.9

    申请日:2015-03-25

    Inventor: 罗兆海 李献

    Abstract: 本公开涉及用于确定词间距的方法和设备以及用于分词的方法和系统。一种用于确定文档图像中的词间距的方法包括:划分步骤,将文档图像划分为文本图像块,然后将文本图像块划分为行图像区域,并且将每个行图像区域划分成字符或连通字符区域;第一获得步骤,对于至少一个行图像区域,通过聚类方法得到第一词间距阈值,由此,在至少一个行图像区域中的各间距之中,大于该第一词间距阈值的间距被称为初始词间距,小于或等于该第一词间距阈值的间距被称为初始字符间距;和调整步骤,根据该文档图像中的上下文信息,调整所述第一词间距阈值以获得第二词间距阈值,以便根据该第二词间距阈值来确定至少一个行图像区域中的最终词间距。

    对象形状对准装置、对象处理装置及其方法

    公开(公告)号:CN105426929B

    公开(公告)日:2018-11-27

    申请号:CN201410482349.3

    申请日:2014-09-19

    Abstract: 本发明涉及对象形状对准装置、对象处理装置及其方法。对象形状对准装置包括:从多个训练样本获取包含平均对象形状、多个回归函数和多个特征选择图的对象形状回归模型的单元;基于平均对象形状设定初始对象形状的单元;计算关于初始对象形状的多个特征点的至少一个特征向量的单元;对于初始对象形状的所述多个特征点的每个坐标,基于所述多个特征选择图中的相应一个从计算出的特征向量选择特征片段并将特征片段组装成子特征向量的单元;以及对于初始对象形状的至少一个特征点的至少一个坐标,基于相应的子特征向量和所述多个回归函数中的相应一个预测坐标增量的单元。本发明的装置和方法可减小模型尺寸、实现更高精度和/或速度和/或鲁棒性等。

    用于分割输入图像的方法和装置

    公开(公告)号:CN102915530B

    公开(公告)日:2015-11-25

    申请号:CN201110217653.1

    申请日:2011-08-01

    Inventor: 李建杰 李献

    Abstract: 公开了用于分割输入图像的方法和装置。输入图像包括一个或更多个文档域。该方法包括:检测输入图像中的边缘,作为检测的边界边缘;将检测的边界边缘投影到至少一个轴上;以及基于投影结果将输入图像分割成至少一个分割区域。

    文档的自适应二值化方法和设备

    公开(公告)号:CN100561504C

    公开(公告)日:2009-11-18

    申请号:CN200510138132.1

    申请日:2005-12-22

    Inventor: 曾旭 李献 肖其林

    Abstract: 本申请涉及一种对文档进行自适应二值化的方法、设备和存储介质。本发明的对灰度级文档图像进行自适应二值化的方法包括:划分步骤,将灰度级文档划分为块;第一确定步骤,根据块的特征确定所划分的块当中的背景块和文本块;第二确定步骤,确定第一确定步骤所确定的每一个文本块所包括的像素中的背景像素;第一计算步骤,计算表示每一个块的阈值的块阈值面,其中,基于第一确定步骤所确定的背景块中所包括的所有像素计算该背景块的阈值,基于第一确定步骤所确定的文本块中所包括的背景像素计算该文本块的阈值,背景像素是在第二确定步骤中所确定的;以及二值化步骤,使用第一计算步骤所计算的块阈值面来将灰度级文档图像二值化。

    增强字符行图像的方法和设备

    公开(公告)号:CN100354876C

    公开(公告)日:2007-12-12

    申请号:CN200510065182.1

    申请日:2005-04-13

    Inventor: 肖其林 李献

    Abstract: 本发明涉及增强字符行图像的方法、设备和存储介质。为了提高OCR识别率,首先将字符行的图像分类为至少三种类型中的一种,包括图像质量最好的清楚类型、几乎没有噪声但是笔画为断笔的断笔类型,以及具有比清楚类型多的噪声但是几乎没有断笔的其它类型,然后根据类型增强图像。增强操作包括:如果原始图像是清楚类型则删除独立噪声;如果原始图像是断笔类型则对原始图像执行十字膨胀;如果原始图像是其它类型则删除独立噪声,然后对所得到的图像进行平滑。根据行图像中的点噪声和块噪声数量,以及行中的可能字符数,可以将所述其它类型进一步划分为更细的类型,施以不同的增强方法。另外,根据类型,可以使用不同的手段减少边缘噪声。

Patent Agency Ranking