-
公开(公告)号:CN111583156A
公开(公告)日:2020-08-25
申请号:CN202010403455.3
申请日:2020-05-13
Applicant: 中国科学院自动化研究所
Abstract: 本发明涉及一种文档图像底纹去除方法及系统,所述去除方法包括:对原始文档图像进行二值化处理,得到二值化图像;提取二值化图像的边缘,得到边缘图像;融合边缘图像的设定距离的边缘,得到融合图像;根据融合图像及边缘图像,得到底纹纹理图;将原始文档图像等分成多个图像块;从图像块的各像素点中提取对应在所述底纹纹理图中被标记为底纹像素点的第一像素点;计算各第一像素点的像素值的均值,得到图像块的纹理均值;计算像素点的像素值与纹理均值之间的距离值;当距离值小于或等于颜色距离阈值,则将像素点对应的二值化图像中的像素点置零,得到二值化结果图像,在去除底纹的同时能有效的保留文档中被底纹干扰的文本信息。
-
公开(公告)号:CN111611933B
公开(公告)日:2023-07-14
申请号:CN202010441086.7
申请日:2020-05-22
Applicant: 中国科学院自动化研究所
IPC: G06V30/40 , G06V30/148 , G06V30/19 , G06V10/80 , G06N3/08 , G06N3/0464 , G06V10/82
Abstract: 本发明涉及一种文档图像的信息提取方法及系统,所述提取方法包括:基于全卷积神经网络,根据待识别文档图像,得到字符感知响应图;采用分水岭算法,对字符感知响应图进行分割,得到多个分割图像;通过连通域提取方法,对各分割图像进行字符提取,得到各分割图像中的字符;基于深度神经网络的字符识别模型,对各字符进行识别,确定各字符的位置信息;根据位置信息,对字符进行合并,得到待识别图像的识别信息。本发明通过全卷积神经网络、分水岭算法、连通域提取方法,确定待识别文档图像的各分割图像中的字符,并基于深度神经网络的字符识别模型,确定各字符的位置信息;进而根据位置信息对字符进行合并,可准确得到待识别图像的识别信息。
-
公开(公告)号:CN111583156B
公开(公告)日:2023-06-23
申请号:CN202010403455.3
申请日:2020-05-13
Applicant: 中国科学院自动化研究所
Abstract: 本发明涉及一种文档图像底纹去除方法及系统,所述去除方法包括:对原始文档图像进行二值化处理,得到二值化图像;提取二值化图像的边缘,得到边缘图像;融合边缘图像的设定距离的边缘,得到融合图像;根据融合图像及边缘图像,得到底纹纹理图;将原始文档图像等分成多个图像块;从图像块的各像素点中提取对应在所述底纹纹理图中被标记为底纹像素点的第一像素点;计算各第一像素点的像素值的均值,得到图像块的纹理均值;计算像素点的像素值与纹理均值之间的距离值;当距离值小于或等于颜色距离阈值,则将像素点对应的二值化图像中的像素点置零,得到二值化结果图像,在去除底纹的同时能有效的保留文档中被底纹干扰的文本信息。
-
公开(公告)号:CN111611933A
公开(公告)日:2020-09-01
申请号:CN202010441086.7
申请日:2020-05-22
Applicant: 中国科学院自动化研究所
Abstract: 本发明涉及一种文档图像的信息提取方法及系统,所述提取方法包括:基于全卷积神经网络,根据待识别文档图像,得到字符感知响应图;采用分水岭算法,对字符感知响应图进行分割,得到多个分割图像;通过连通域提取方法,对各分割图像进行字符提取,得到各分割图像中的字符;基于深度神经网络的字符识别模型,对各字符进行识别,确定各字符的位置信息;根据位置信息,对字符进行合并,得到待识别图像的识别信息。本发明通过全卷积神经网络、分水岭算法、连通域提取方法,确定待识别文档图像的各分割图像中的字符,并基于深度神经网络的字符识别模型,确定各字符的位置信息;进而根据位置信息对字符进行合并,可准确得到待识别图像的识别信息。
-
公开(公告)号:CN305049356S
公开(公告)日:2019-02-26
申请号:CN201830068060.6
申请日:2018-02-12
Applicant: 中国科学院自动化研究所
Abstract: 1.本外观设计产品的名称:用于移动终端的图形用户界面。
2.本外观设计产品的用途:通过移动终端采集图像,例如飞机票;3.本外观设计产品的设计要点:所示产品的图形用户界面及其交互过程;4.最能表明本外观设计设计要点的图片或照片:主视图;5.交互说明:主视图为点击移动终端拍照按钮后所进入的界面,该界面的取景框包括图像采集区、飞机行程单红色印章区域、飞机行程单印刷序号区域、局部文字区域、放大显示区;使用状态参考图是取景框扫描到飞机票的状态,可以根据用户所需调整焦距进行拍摄;参考图中文字序号表示为:(1)图像采集区;(2)飞机行程单红色印章区域;(3)机行程单印刷序号区域;(4)局部文字区域,该区域可以通过触控方式在(1)图像采集区中随意移动;(5)放大显示区,该区域可以放大显示(4)局部文字区域中的内容。-
公开(公告)号:CN305049357S
公开(公告)日:2019-02-26
申请号:CN201830068073.3
申请日:2018-02-12
Applicant: 中国科学院自动化研究所
Abstract: 1.本外观设计产品的名称:用于移动终端的图形用户界面。
2.本外观设计产品的用途:通过移动终端采集图像,例如出租车票;3.本外观设计产品的设计要点:所示产品的图形用户界面及其交互过程;4.最能表明本外观设计设计要点的图片或照片:主视图;5.交互说明:主视图为点击移动终端拍照按钮后所进入的界面,该界面的取景框包括图像采集区、红色印章区域、局部文字区域、放大显示区;使用状态参考图是取景框扫描到出租车票的状态,可以根据用户所需调整焦距进行拍摄;参考图中文字序号表示为:(1)图像采集区;(2)红色印章区域;(3)局部文字区域,该区域可以通过触控方式在(1)图像采集区中随意移动;(4)放大显示区,该区域可以放大显示(4)局部文字区域中的内容。-
公开(公告)号:CN305049355S
公开(公告)日:2019-02-26
申请号:CN201830068059.3
申请日:2018-02-12
Applicant: 中国科学院自动化研究所
Abstract: 1.本外观设计产品的名称:用于移动终端的图形用户界面。
2.本外观设计产品的用途:通过移动终端采集图像,例如火车票;3.本外观设计产品的设计要点:所示产品的图形用户界面及其交互过程;4.最能表明本外观设计设计要点的图片或照片:主视图;5.主视图为点击移动终端拍照按钮后所进入的界面,该界面的取景框包括图像采集区、二维码引导区域、顶部箭头引导区域、局部文字区域、放大显示区;使用状态参考图是取景框扫描到火车票的状态,可以根据用户所需调整焦距进行拍摄;参考图中文字序号表示为:(1)图像采集区;(2)二维码引导区域;(3)顶部箭头引导区域;(4)局部文字区域,该区域可以通过触控方式在(1)图像采集区中随意移动;(5)放大显示区,该区域可以放大显示(4)局部文字区域中的内容。
-
-
-
-
-
-