-
公开(公告)号:CN117765561A
公开(公告)日:2024-03-26
申请号:CN202311547095.4
申请日:2023-11-16
Applicant: 乌鲁木齐市公安局刑事侦查支队 , 中国科学院自动化研究所
IPC: G06V30/416 , G06V30/19 , G06V10/74 , G06V10/82
Abstract: 本发明提供一种基于深度学习的印章图像真伪鉴别方法及装置,所述方法包括:获取待鉴别印章图像和对应的参照图像,参照图像为真印章图像;将待鉴别印章图像和参照图像进行图像配准对齐;通过基于Siamese的特征提取神经网络,对图像配准对齐后的待鉴别印章图像和参照图像进行特征提取,得到待鉴别印章图像的深度学习特征和参照图像的深度学习特征,基于Siamese的特征提取神经网络包括至少两个通过SE‑Block结构在中间层相互连接的特征提取子网络,特征提取子网络的网络结构为DenseNet结构;基于待鉴别印章图像的深度学习特征和所述参照图像的深度学习特征,进行相似性度量后鉴别所述待鉴别印章图像的真伪。
-
公开(公告)号:CN116863456B
公开(公告)日:2024-03-22
申请号:CN202310626483.5
申请日:2023-05-30
Applicant: 中国科学院自动化研究所
IPC: G06V20/62 , G06V20/40 , G06V10/80 , G06V10/82 , G06N3/045 , G06N3/0442 , G06N3/0464 , G06N3/082
Abstract: 本申请实施例提供一种视频文本识别方法、装置及存储介质。该方法包括:获取待处理的视频图像;利用可变形自注意力机制对多种分辨率的所述视频图像进行特征融合,获得编码输出特征;基于所述编码输出特征利用自注意力机制确定文本识别结果。本申请实施例提供的视频文本识别方法、装置及存储介质,利用可变形自注意力机制将高分辨率特征图与低分辨率特征图的融合,实现了对小目标的检测和识别,提高了视频文本识别的准确性。
-
公开(公告)号:CN110321892B
公开(公告)日:2022-12-13
申请号:CN201910482362.1
申请日:2019-06-04
Applicant: 腾讯科技(深圳)有限公司 , 中国科学院自动化研究所
Abstract: 本发明公开了一种图片筛选方法、装置及电子设备,其中图片筛选方法包括:获取待筛选图片;将待筛选图片输入文字图片识别模型进行包含文字信息的图片区域的识别处理,得到识别结果;当所述识别结果中存在包含文字信息的图片区域时,选取待筛选图片作为目标图片;其中,所述文字图片识别模型包括基于目标深层神经网络模型输出的特征数据,与所述输出相对应的输入图片以及所述输入图片对应的标签信息进行机器学习确定的浅层神经网络模型。本发明实现了基于具有深层神经网络模型预测能力的浅层神经网络模型即文字图片识别模型进行图片中图片区域是否包含文字信息的识别,不仅大大提高了图片筛选的速度,而且保证了筛选的稳定性和筛选精度。
-
公开(公告)号:CN107977592B
公开(公告)日:2022-11-01
申请号:CN201610921016.5
申请日:2016-10-21
Applicant: 中兴通讯股份有限公司 , 中国科学院自动化研究所
IPC: G06V30/414 , G06V30/18 , G06V30/19
Abstract: 本发明实施例提供了一种图像文本检测方法及系统、用户终端及服务器;该方法包括:用户终端获取多个显著性图像,生成候选文本连通构件;服务器根据候选文本连通构件获取文本连通部件,将文本连通部件视作节点,连接近邻节点对构成无向图,对无向图中有公共节点的边依次进行融合,获得多个文本行;用户终端对多个文本行进行交叠融合,生成图像文本检测结果;服务器对图像文本检测结果进行识别得到最终文本;用户终端输出最终文本。本发明通过基于显著性模型的文件检测和根据无向图每条边的局部特征和全局特征进行分类得到文本行,提高了图像文本检测效率,降低了计算复杂度。
-
公开(公告)号:CN110321892A
公开(公告)日:2019-10-11
申请号:CN201910482362.1
申请日:2019-06-04
Applicant: 腾讯科技(深圳)有限公司 , 中国科学院自动化研究所
Abstract: 本发明公开了一种图片筛选方法、装置及电子设备,其中图片筛选方法包括:获取待筛选图片;将待筛选图片输入文字图片识别模型进行包含文字信息的图片区域的识别处理,得到识别结果;当所述识别结果中存在包含文字信息的图片区域时,选取待筛选图片作为目标图片;其中,所述文字图片识别模型包括基于目标深层神经网络模型输出的特征数据,与所述输出相对应的输入图片以及所述输入图片对应的标签信息进行机器学习确定的浅层神经网络模型。本发明实现了基于具有深层神经网络模型预测能力的浅层神经网络模型即文字图片识别模型进行图片中图片区域是否包含文字信息的识别,不仅大大提高了图片筛选的速度,而且保证了筛选的稳定性和筛选精度。
-
公开(公告)号:CN109685065A
公开(公告)日:2019-04-26
申请号:CN201811512183.X
申请日:2018-12-11
Applicant: 中国科学院自动化研究所
CPC classification number: G06K9/342 , G06K9/3233 , G06K9/6835 , G06N3/0454
Abstract: 本发明提出一种试卷内容自动分类的版面分析方法及系统,所述方法包括:获取录入的文档图像;提取所述文档图像的连通部件构成原始联通部件集;根据文档图像的连通部件,对各连通部件进行文本和非文本的分类,获取第一文本连通部件集、非文本连通部件集;对非文本连通部件集中各连通部件,进行文字部件的检测和切分,获得粘连在非文本分类的连通部件中的文字部件,并将该部件增入第一文本连通部件集,得到第二文本连通部件集;对所述第二文本连通部件集中各连通部件,进行印刷体文字和手写体文字的分类;输出文档图像内容的分类结果。采用本发明的方法将元素的分类问题转化成了一个求解所有元素的联合概率最大的全局优化问题,从而可以提升整体的分类正确率。
-
-
-
-
-