-
公开(公告)号:CN109543777B
公开(公告)日:2020-10-27
申请号:CN201811433192.X
申请日:2018-11-28
Applicant: 中国科学院自动化研究所
Abstract: 本发明涉及一种手写汉字书写质量评价方法及系统,所述评价方法包括:获取待评价手写汉字图像;去除所述待评价手写汉字图像中的田字格,得到字体图像;对所述字体图像进行灰度化处理,得到灰度图像;对所述灰度图像进行透视化处理得到变换图像;将变换图像分割成多个单个的汉字;通过卷积神经网络对各个汉字进行评价,确定待评价手写汉字图像的书写质量。本发明通过待评价手写汉字图像依次进行去除田字格处理、灰度处理、透视化处理、分割处理,通过卷积神经网络对单个汉字进行评价,从而确定待评价手写汉字图像的书写质量,整个过程减少人为的参与,全程机器化、全自动处理,从而可提高书写质量评价的准确性。
-
公开(公告)号:CN109543777A
公开(公告)日:2019-03-29
申请号:CN201811433192.X
申请日:2018-11-28
Applicant: 中国科学院自动化研究所
Abstract: 本发明涉及一种手写汉字书写质量评价方法及系统,所述评价方法包括:获取待评价手写汉字图像;去除所述待评价手写汉字图像中的田字格,得到字体图像;对所述字体图像进行灰度化处理,得到灰度图像;对所述灰度图像进行透视化处理得到变换图像;将变换图像分割成多个单个的汉字;通过卷积神经网络对各个汉字进行评价,确定待评价手写汉字图像的书写质量。本发明通过待评价手写汉字图像依次进行去除田字格处理、灰度处理、透视化处理、分割处理,通过卷积神经网络对单个汉字进行评价,从而确定待评价手写汉字图像的书写质量,整个过程减少人为的参与,全程机器化、全自动处理,从而可提高书写质量评价的准确性。
-
公开(公告)号:CN102542268B
公开(公告)日:2014-04-23
申请号:CN201110451826.6
申请日:2011-12-29
Applicant: 中国科学院自动化研究所
IPC: G06K9/32
Abstract: 一种用于视频中文本区域检测与定位的方法,其特征在于,包含如下步骤:输入视频,按等时间间隔对输入视频进行采样;对采样得到的图像进行边缘检测;利用检测后得到的图像生成文本置信度图;根据生成的文本置信度图提取文本候选区域;对文本候选区域近似相同的多帧图像的文本候选区域进行融合;对融合后的文本区域图像进行分行。本发明的文本检测与定位方法能够实时地对视频中出现的多语言文本进行准确定位。可以适用于视频内容编辑、索引与检索等多种用途。
-
公开(公告)号:CN102332096B
公开(公告)日:2013-01-02
申请号:CN201110315054.3
申请日:2011-10-17
Applicant: 中国科学院自动化研究所
Abstract: 本发明公开了一种视频字幕文本提取和识别的方法,其步骤包括:输入视频中字幕区域的图像;将输入图像转化为灰度图;判断字幕区域中字符排列的方向;将竖直排列的字幕区域逆时针旋转90°得到水平字幕区域;对字幕区域进行分行得到单行字幕图像;对单行字幕区域图像自动判断前景颜色,得到单行字幕二值图像;对单行字幕二值图像进行过切分得到字符片段序列;对过切分后的单行字幕二值图像进行文本行识别。本方法能有效分割水平和竖直的视频字幕文本行,准确判断字符前景颜色并滤除噪声,并得到准确的字符切分与识别结果,可以适用于视频和图像内容编辑、索引与检索等多种用途。
-
公开(公告)号:CN102332096A
公开(公告)日:2012-01-25
申请号:CN201110315054.3
申请日:2011-10-17
Applicant: 中国科学院自动化研究所
Abstract: 本发明公开了一种视频字幕文本提取和识别的方法,其步骤包括:输入视频中字幕区域的图像;将输入图像转化为灰度图;判断字幕区域中字符排列的方向;将竖直排列的字幕区域逆时针旋转90°得到水平字幕区域;对字幕区域进行分行得到单行字幕图像;对单行字幕区域图像自动判断前景颜色,得到单行字幕二值图像;对单行字幕二值图像进行过切分得到字符片段序列;对过切分后的单行字幕二值图像进行文本行识别。本方法能有效分割水平和竖直的视频字幕文本行,准确判断字符前景颜色并滤除噪声,并得到准确的字符切分与识别结果,可以适用于视频和图像内容编辑、索引与检索等多种用途。
-
公开(公告)号:CN117765561B
公开(公告)日:2024-10-29
申请号:CN202311547095.4
申请日:2023-11-16
Applicant: 乌鲁木齐市公安局刑事侦查支队 , 中国科学院自动化研究所
IPC: G06V30/416 , G06V30/19 , G06V10/74 , G06V10/82
Abstract: 本发明提供一种基于深度学习的印章图像真伪鉴别方法及装置,所述方法包括:获取待鉴别印章图像和对应的参照图像,参照图像为真印章图像;将待鉴别印章图像和参照图像进行图像配准对齐;通过基于Siamese的特征提取神经网络,对图像配准对齐后的待鉴别印章图像和参照图像进行特征提取,得到待鉴别印章图像的深度学习特征和参照图像的深度学习特征,基于Siamese的特征提取神经网络包括至少两个通过SE‑Block结构在中间层相互连接的特征提取子网络,特征提取子网络的网络结构为DenseNet结构;基于待鉴别印章图像的深度学习特征和所述参照图像的深度学习特征,进行相似性度量后鉴别所述待鉴别印章图像的真伪。
-
公开(公告)号:CN118537867A
公开(公告)日:2024-08-23
申请号:CN202410673996.6
申请日:2024-05-28
Applicant: 中国科学院自动化研究所 , 乌鲁木齐市公安局刑事侦查支队
IPC: G06V30/148 , G06V30/19 , G06V10/56
Abstract: 本发明提供一种多语种印章文字识别方法、装置、电子设备和存储介质,属于光学字符识别技术领域,该方法包括:使用SAM分割模型对目标印章印文图像进行分割,获得每一个印章文字的mask和特征向量;基于所述每一个印章文字的mask和特征向量,对所述每一个印章文字进行聚类,获得至少一个文字行;分别将所述至少一个文字行中的文字按相对位置进行排序;基于所述每一个印章文字的mask,使用Transformer编码器识别排序后的所述至少一个文字行,输出所述每一个印章文字的字符外框、字符类别和所述文字行的语种。可以提高印章图像识别的效果和准确率。
-
公开(公告)号:CN107977592A
公开(公告)日:2018-05-01
申请号:CN201610921016.5
申请日:2016-10-21
Applicant: 中兴通讯股份有限公司 , 中国科学院自动化研究所
CPC classification number: G06K9/00456 , G06K9/344 , G06K9/6269
Abstract: 本发明实施例提供了一种图像文本检测方法及系统、用户终端及服务器;该方法包括:用户终端获取多个显著性图像,生成候选文本连通构件;服务器根据候选文本连通构件获取文本连通部件,将文本连通部件视作节点,连接近邻节点对构成无向图,对无向图中有公共节点的边依次进行融合,获得多个文本行;用户终端对多个文本行进行交叠融合,生成图像文本检测结果;服务器对图像文本检测结果进行识别得到最终文本;用户终端输出最终文本。本发明通过基于显著性模型的文件检测和根据无向图每条边的局部特征和全局特征进行分类得到文本行,提高了图像文本检测效率,降低了计算复杂度。
-
公开(公告)号:CN119919946A
公开(公告)日:2025-05-02
申请号:CN202510390289.0
申请日:2025-03-31
Applicant: 中国科学院自动化研究所
IPC: G06V30/148 , G06V30/413 , G06V30/412 , G06V30/24 , G06V10/764 , G06V10/82 , G06N3/0455
Abstract: 本发明涉及图像分割领域,提供一种基于查询解耦和原型分类的通用文档图像分割方法,包括:利用视觉骨架网络对输入文档图像提取多尺度视觉特征,并进行优化得到优化后的多尺度视觉特征;利用文本编码器将每类待分割区域类别的文字描述编码成语义查询向量,并随机初始化预设数量的实例查询向量;将优化后的多尺度视觉特征、语义查询向量以及实例查询向量输入混合查询解码器中得到更新后的语义查询向量和实例查询向量;利用更新后的语义查询向量和实例查询向量分别进行语义分割和实例分割,得到语义分割结果和实例分割结果。本发明不仅能处理多种类型文档图像上的多种分割任务,还能够以任意文档图像和分割任务提示为输入,输出相应的分割结果。
-
公开(公告)号:CN118537867B
公开(公告)日:2025-02-07
申请号:CN202410673996.6
申请日:2024-05-28
Applicant: 中国科学院自动化研究所 , 乌鲁木齐市公安局刑事侦查支队
IPC: G06V30/148 , G06V30/19 , G06V10/56
Abstract: 本发明提供一种多语种印章文字识别方法、装置、电子设备和存储介质,属于光学字符识别技术领域,该方法包括:使用SAM分割模型对目标印章印文图像进行分割,获得每一个印章文字的mask和特征向量;基于所述每一个印章文字的mask和特征向量,对所述每一个印章文字进行聚类,获得至少一个文字行;分别将所述至少一个文字行中的文字按相对位置进行排序;基于所述每一个印章文字的mask,使用Transformer编码器识别排序后的所述至少一个文字行,输出所述每一个印章文字的字符外框、字符类别和所述文字行的语种。可以提高印章图像识别的效果和准确率。
-
-
-
-
-
-
-
-
-