一种零训练样本行为识别方法

    公开(公告)号:CN103400160A

    公开(公告)日:2013-11-20

    申请号:CN201310364990.2

    申请日:2013-08-20

    Abstract: 本发明公开了一种零训练样本行为识别方法,该方法包括以下步骤:提取每个动作视频样本的特征向量;设定多个人体运动属性以及每个人体运动属性下动作视频对之间的关系;将动作视频对关系作为输入,利用排序支持向量机进行训练;利用输出的排序分数,对每一类有训练样本的人体行为拟合得到混合高斯模型;利用迁移学习获得零训练样本人体行为类别的混合高斯模型;提取测试视频样本的特征向量;利用最大后验概率原则,判断测试视频样本中零训练样本人体行为所属的类别。本发明通过利用混合高斯模型拟合排序分数,达到行为识别的目的,并通过最大后验判断所属类别,从而提高行为识别的鲁棒性。

    一种基于超像素分割的地基云自动检测方法

    公开(公告)号:CN103035001A

    公开(公告)日:2013-04-10

    申请号:CN201210520167.1

    申请日:2012-12-06

    Abstract: 本发明公开了一种基于超像素分割的地基云自动检测方法,该方法包括:利用超像素分割算法将输入的RGB云图分割为多个超像素块;根据各颜色通道的图像,得到特征图像;计算每一超像素块的局部阈值;利用双线性插值算法得到阈值矩阵;比较阈值矩阵与特征图像得到每个像素点的判断结果;利用判断结果以及像素点之间的位置对应关系,得到输入的RGB云图的云检测结果。本发明方法能够尽可能地保持超像素块中的一致性,获得更好的云检测结果,从而具有较好的鲁棒性和准确性。

    基于类别相关的码本和分类器投票策略的图像分类方法

    公开(公告)号:CN102156871B

    公开(公告)日:2012-12-12

    申请号:CN201010112518.6

    申请日:2010-02-12

    Abstract: 本发明为基于类别相关的码本和分类器投票策略的图像分类方法,首先图像数据集预处理模块将图像表示为局部显著区域图像块的集合;类别相关的码本生成模块生成类别相关的码本;图像向量化模块根据类别相关的码本,将图像表示为图像向量,类别相关分类器训练模块选择其中的训练图像向量和训练图像对应的类别标签训练任意两个类别之间的分类器;最后,基于分类器投票策略的测试图像分类模块根据各个分类器的投票结果,确定测试图像的类别标签。类别相关码本生成模块有效地解决了码本过大导致维数灾难与码本过小判别性不足的矛盾;同时类别相关的分类器训练模块也摆脱了多类别分类中样本不均衡产生的问题,提高了分类性能。

    一种扫描文档图像自动配准方法

    公开(公告)号:CN101872475A

    公开(公告)日:2010-10-27

    申请号:CN200910082084.7

    申请日:2009-04-22

    Abstract: 本发明为一种扫描文档图像配准的方法,步骤如下:由改进的特征点检测、旋转参数粗估计、特征点粗匹配、误匹配特征点剔除、精细匹配共五个步骤:对于标准扫描文档图像和待匹配扫描文档图像采用改进的特征点检测算法检测特征点,由特征点的位置估计待匹配扫描文档图像相对与标准扫描文档图像的粗步旋转角度,对于标准图像和经过粗步旋转后的扫描文档图像中的特征点用归一化相关法计算匹配特征点对,并用改进随机采样一致性鲁棒算法剔除误匹配,通过八邻域搜索得到精确的匹配点对的位置,计算标准扫描文档图像与粗步旋转后的待匹配扫描文档图像间的匹配参数,将参数作用于粗步旋转后的待匹配扫描文档图像得到配准图像。

    基于模板匹配的信息填涂卡识别方法

    公开(公告)号:CN101414356B

    公开(公告)日:2010-09-15

    申请号:CN200710175973.9

    申请日:2007-10-17

    Abstract: 本发明涉及基于模板匹配的信息填涂卡识别方法,利用空白信息卡建立模板图像信息,获得模板信息卡;设置模板信息卡涂点选项的有效填涂阈值;提取待识别模板信息卡涂点模板选项的背景模式定义,分别调用模板选项不同的背景模式进行涂点识别;若识别涂点结果大于等于设定的阈值,则认为该选项被有效填涂,否则是无效填涂;本发明能适用于不同类型灰度模式的识别,识别结果分级,灵活性高,能提高整体识别率;可批量识别,实现人机结合,更好地满足了实际应用的需要。本发明对所有选项区域进行定义,获得准确的模板信息。利用当前图像与模板图像之间的差异性进行识别,解决了纹理背景干扰的问题。

    一种文档图像的配准及特征点选取方法

    公开(公告)号:CN101377847A

    公开(公告)日:2009-03-04

    申请号:CN200710121080.6

    申请日:2007-08-29

    Abstract: 本发明涉及图像处理学科技术领域,特别是一种通用型文档图像的配准及特征点选取方法。该方法以图像轮廓作为文档图像配准特征,并以轮廓点表示文档图像轮廓。方法过程为:首先,以文档图像轮廓点为候选点,通过特征点选择方法分别在参考图像和配准图像中自动选取若干点作为图像配准特征点;然后,以射影变换不变量作为相似度量,在特征点集中寻找若干个候选的匹配点集对,并计算出点集对对应的几何变换作为候选配准变换;最后,以轮廓匹配度为度量,从候选配准变换中寻找最优匹配的变换,作为最终配准变换,对文档图像进行配准。该方法能胜任不同类型文档图像的配准,并且在效率和鲁棒性上表现良好。

    文档图像底纹去除方法及系统

    公开(公告)号:CN111583156B

    公开(公告)日:2023-06-23

    申请号:CN202010403455.3

    申请日:2020-05-13

    Abstract: 本发明涉及一种文档图像底纹去除方法及系统,所述去除方法包括:对原始文档图像进行二值化处理,得到二值化图像;提取二值化图像的边缘,得到边缘图像;融合边缘图像的设定距离的边缘,得到融合图像;根据融合图像及边缘图像,得到底纹纹理图;将原始文档图像等分成多个图像块;从图像块的各像素点中提取对应在所述底纹纹理图中被标记为底纹像素点的第一像素点;计算各第一像素点的像素值的均值,得到图像块的纹理均值;计算像素点的像素值与纹理均值之间的距离值;当距离值小于或等于颜色距离阈值,则将像素点对应的二值化图像中的像素点置零,得到二值化结果图像,在去除底纹的同时能有效的保留文档中被底纹干扰的文本信息。

    基于单字匹配的文档图像中文关键词检测方法、系统

    公开(公告)号:CN110059572B

    公开(公告)日:2021-08-10

    申请号:CN201910222318.7

    申请日:2019-03-22

    Abstract: 本发明属于文本图像识别技术领域,具体涉及一种基于单字匹配的文档图像中文关键词检测方法、系统,旨在解决解决文档图像图像质量不稳定及汉字排列多样性带来的中文关键词识别的准确度和鲁棒性不足的问题,本发明方法包括:对文档图像进行二值化处理得到第一图像;进行字符检测得到第一候选字符集合;对第一候选字符集合进行过滤得到第二候选字符集合、第一噪声候选字符集合;从第一噪声候选字符集合筛选字符并添加至第二候选字符集合,得到第三候选字符集合;进行候选字符组合得到第一候选词集合;进行丢失字符的二次检测得到第二候选词集合;基于代价函数,选择最终的关键词检测结果。本发明提高了文档关键词识别的准确度,具有高鲁棒性。

    文档图像的信息提取方法及系统

    公开(公告)号:CN111611933A

    公开(公告)日:2020-09-01

    申请号:CN202010441086.7

    申请日:2020-05-22

    Abstract: 本发明涉及一种文档图像的信息提取方法及系统,所述提取方法包括:基于全卷积神经网络,根据待识别文档图像,得到字符感知响应图;采用分水岭算法,对字符感知响应图进行分割,得到多个分割图像;通过连通域提取方法,对各分割图像进行字符提取,得到各分割图像中的字符;基于深度神经网络的字符识别模型,对各字符进行识别,确定各字符的位置信息;根据位置信息,对字符进行合并,得到待识别图像的识别信息。本发明通过全卷积神经网络、分水岭算法、连通域提取方法,确定待识别文档图像的各分割图像中的字符,并基于深度神经网络的字符识别模型,确定各字符的位置信息;进而根据位置信息对字符进行合并,可准确得到待识别图像的识别信息。

    图像检索方法及系统
    30.
    发明公开

    公开(公告)号:CN111198964A

    公开(公告)日:2020-05-26

    申请号:CN202010026336.0

    申请日:2020-01-10

    Abstract: 本发明涉及一种图像检索方法及系统,所述检索方法包括:对训练图像集标记类别,得到多个标记图像;根据各所述标记图像,进行建模,得到基于对抗注意力机制的卷积神经网络模型;获取参考图库的各参考图像;通过所述卷积神经网络模型,分别提取待检索图像及各参考图像对应的全局特征;根据所述待检索图像及各参考图像对应的全局特征,确定检索结果;所述检索结果为选取与所述待检索图像不相似的参考图像,作为推荐图像。本发明根据训练图像集建模,得到基于对抗注意力机制的卷积神经网络模型,可直接提取待检索图像及各参考图像对应的全局特征;进而可根据待检索图像及各参考图像对应的全局特征,准确得到与所述待检索图像不相似的推荐图像。

Patent Agency Ranking