-
公开(公告)号:CN102542268B
公开(公告)日:2014-04-23
申请号:CN201110451826.6
申请日:2011-12-29
Applicant: 中国科学院自动化研究所
IPC: G06K9/32
Abstract: 一种用于视频中文本区域检测与定位的方法,其特征在于,包含如下步骤:输入视频,按等时间间隔对输入视频进行采样;对采样得到的图像进行边缘检测;利用检测后得到的图像生成文本置信度图;根据生成的文本置信度图提取文本候选区域;对文本候选区域近似相同的多帧图像的文本候选区域进行融合;对融合后的文本区域图像进行分行。本发明的文本检测与定位方法能够实时地对视频中出现的多语言文本进行准确定位。可以适用于视频内容编辑、索引与检索等多种用途。
-
公开(公告)号:CN102332096B
公开(公告)日:2013-01-02
申请号:CN201110315054.3
申请日:2011-10-17
Applicant: 中国科学院自动化研究所
Abstract: 本发明公开了一种视频字幕文本提取和识别的方法,其步骤包括:输入视频中字幕区域的图像;将输入图像转化为灰度图;判断字幕区域中字符排列的方向;将竖直排列的字幕区域逆时针旋转90°得到水平字幕区域;对字幕区域进行分行得到单行字幕图像;对单行字幕区域图像自动判断前景颜色,得到单行字幕二值图像;对单行字幕二值图像进行过切分得到字符片段序列;对过切分后的单行字幕二值图像进行文本行识别。本方法能有效分割水平和竖直的视频字幕文本行,准确判断字符前景颜色并滤除噪声,并得到准确的字符切分与识别结果,可以适用于视频和图像内容编辑、索引与检索等多种用途。
-
公开(公告)号:CN102332096A
公开(公告)日:2012-01-25
申请号:CN201110315054.3
申请日:2011-10-17
Applicant: 中国科学院自动化研究所
Abstract: 本发明公开了一种视频字幕文本提取和识别的方法,其步骤包括:输入视频中字幕区域的图像;将输入图像转化为灰度图;判断字幕区域中字符排列的方向;将竖直排列的字幕区域逆时针旋转90°得到水平字幕区域;对字幕区域进行分行得到单行字幕图像;对单行字幕区域图像自动判断前景颜色,得到单行字幕二值图像;对单行字幕二值图像进行过切分得到字符片段序列;对过切分后的单行字幕二值图像进行文本行识别。本方法能有效分割水平和竖直的视频字幕文本行,准确判断字符前景颜色并滤除噪声,并得到准确的字符切分与识别结果,可以适用于视频和图像内容编辑、索引与检索等多种用途。
-
公开(公告)号:CN118885443B
公开(公告)日:2024-12-27
申请号:CN202411357179.6
申请日:2024-09-27
Applicant: 中国科学院自动化研究所
IPC: G06F16/11 , G06V30/14 , G06V30/148 , G06V30/18 , G06V30/413 , G06V30/42 , G06F16/16
Abstract: 本发明提供一种PDF文档图文对的提取方法、装置、设备及存储介质,属于数据处理技术领域,其方法包括:对目标PDF文档进行解析,得到文本块数据和文本块数据对应的文本坐标,将目标PDF文档逐页转换成文档图像;对文本块数据进行筛选去重处理,获取候选图例文本,并确定候选图例文本对应的候选图例文本坐标,基于图像处理技术对文档图像进行处理,提取候选插图区域;基于候选图例文本坐标,对候选图例文本和候选插图区域进行匹配,过滤匹配失败的候选图例文本和匹配失败的候选插图区域,合并属于同一图例的候选插图区域,得到目标PDF文档的图文对匹配结果。从而精准识别并提取PDF文档中的图文对,操作流程简单、硬件资源开销低。
-
公开(公告)号:CN117765561B
公开(公告)日:2024-10-29
申请号:CN202311547095.4
申请日:2023-11-16
Applicant: 乌鲁木齐市公安局刑事侦查支队 , 中国科学院自动化研究所
IPC: G06V30/416 , G06V30/19 , G06V10/74 , G06V10/82
Abstract: 本发明提供一种基于深度学习的印章图像真伪鉴别方法及装置,所述方法包括:获取待鉴别印章图像和对应的参照图像,参照图像为真印章图像;将待鉴别印章图像和参照图像进行图像配准对齐;通过基于Siamese的特征提取神经网络,对图像配准对齐后的待鉴别印章图像和参照图像进行特征提取,得到待鉴别印章图像的深度学习特征和参照图像的深度学习特征,基于Siamese的特征提取神经网络包括至少两个通过SE‑Block结构在中间层相互连接的特征提取子网络,特征提取子网络的网络结构为DenseNet结构;基于待鉴别印章图像的深度学习特征和所述参照图像的深度学习特征,进行相似性度量后鉴别所述待鉴别印章图像的真伪。
-
公开(公告)号:CN116229159B
公开(公告)日:2024-09-03
申请号:CN202310109841.5
申请日:2023-02-02
Applicant: 中国科学院自动化研究所
IPC: G06V10/764 , G06V10/774 , G06V10/77 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本申请公开了一种基于前景子空间的开放集目标检测方法和装置,涉及计算机技术领域,其中方法包括:获取待检测图像;将所述待检测图像输入至目标检测模型,得到所述目标检测模型输出的所述待检测图像对应的前景目标的预测位置和预测类别;所述目标检测模型用于基于所述待检测图像中候选目标的图像特征与前景子空间之间的距离确定所述前景目标,并基于所述前景目标与已知类别对应的原型在所述前景子空间中的投影坐标之间的距离确定所述前景目标的预测类别;所述前景子空间是基于所述已知类别对应的原型特征构建的。本申请提供的方法和装置,提高了前景目标检测的准确性。
-
公开(公告)号:CN118537867A
公开(公告)日:2024-08-23
申请号:CN202410673996.6
申请日:2024-05-28
Applicant: 中国科学院自动化研究所 , 乌鲁木齐市公安局刑事侦查支队
IPC: G06V30/148 , G06V30/19 , G06V10/56
Abstract: 本发明提供一种多语种印章文字识别方法、装置、电子设备和存储介质,属于光学字符识别技术领域,该方法包括:使用SAM分割模型对目标印章印文图像进行分割,获得每一个印章文字的mask和特征向量;基于所述每一个印章文字的mask和特征向量,对所述每一个印章文字进行聚类,获得至少一个文字行;分别将所述至少一个文字行中的文字按相对位置进行排序;基于所述每一个印章文字的mask,使用Transformer编码器识别排序后的所述至少一个文字行,输出所述每一个印章文字的字符外框、字符类别和所述文字行的语种。可以提高印章图像识别的效果和准确率。
-
公开(公告)号:CN116229159A
公开(公告)日:2023-06-06
申请号:CN202310109841.5
申请日:2023-02-02
Applicant: 中国科学院自动化研究所
IPC: G06V10/764 , G06V10/774 , G06V10/77 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本申请公开了一种基于前景子空间的开放集目标检测方法和装置,涉及计算机技术领域,其中方法包括:获取待检测图像;将所述待检测图像输入至目标检测模型,得到所述目标检测模型输出的所述待检测图像对应的前景目标的预测位置和预测类别;所述目标检测模型用于基于所述待检测图像中候选目标的图像特征与前景子空间之间的距离确定所述前景目标,并基于所述前景目标与已知类别对应的原型在所述前景子空间中的投影坐标之间的距离确定所述前景目标的预测类别;所述前景子空间是基于所述已知类别对应的原型特征构建的。本申请提供的方法和装置,提高了前景目标检测的准确性。
-
公开(公告)号:CN107977592A
公开(公告)日:2018-05-01
申请号:CN201610921016.5
申请日:2016-10-21
Applicant: 中兴通讯股份有限公司 , 中国科学院自动化研究所
CPC classification number: G06K9/00456 , G06K9/344 , G06K9/6269
Abstract: 本发明实施例提供了一种图像文本检测方法及系统、用户终端及服务器;该方法包括:用户终端获取多个显著性图像,生成候选文本连通构件;服务器根据候选文本连通构件获取文本连通部件,将文本连通部件视作节点,连接近邻节点对构成无向图,对无向图中有公共节点的边依次进行融合,获得多个文本行;用户终端对多个文本行进行交叠融合,生成图像文本检测结果;服务器对图像文本检测结果进行识别得到最终文本;用户终端输出最终文本。本发明通过基于显著性模型的文件检测和根据无向图每条边的局部特征和全局特征进行分类得到文本行,提高了图像文本检测效率,降低了计算复杂度。
-
公开(公告)号:CN103577843A
公开(公告)日:2014-02-12
申请号:CN201310597539.5
申请日:2013-11-22
Applicant: 中国科学院自动化研究所
Abstract: 本发明公开了一种空中手写字符串识别系统和方法。该系统包括:手势识别模块,与手指轨迹提取模块连接,用于识别标识开始书写和结束书写的手势;手指轨迹提取模块,与预处理模块连接,用于对输入的手写动作进行手指轨迹的提取和记录;预处理模块,与空中手写字符串识别模块连接,用于对手指轨迹数据进行预处理;字符串识别模块,与预处理模块连接,用于对手指轨迹数据进行字符串识别。本发明还公开了一种空中手写字符串识别方法。本发明支持的书写方式新颖便捷,识别准确迅速,为人们在传统手写方式之外提供了一种更加人性化和智能化的手写输入方式,可广泛适用于人机交互系统中,如游戏操作、电视控制、教学系统等。
-
-
-
-
-
-
-
-
-