-
公开(公告)号:CN114565748B
公开(公告)日:2024-09-10
申请号:CN202210087400.5
申请日:2022-01-25
Applicant: 中通服咨询设计研究院有限公司 , 江苏省通信服务有限公司
Abstract: 本发明公开了一种粗精双模型进出口货物申请表OCR识别方法,包括以下步骤:步骤1,粗模型表头内容匹配定位识别,通过Tesseract‑OCR算法对表头内容进行识别并与制表数据库中的模板信息进行快速匹配,得到整张申请表的行列数和关键字段信息;步骤2,表格内容图像预处理,通过中值滤波和图像锐化操作过滤图像的噪点信息,同时结合阈值分割去除红色印章信息;步骤3,表格cell内容识别以及识别后处理,利用改进的TE‑Efficient算法和CRNN轻量检测网络结构对表格cell小目标特征提取与识别。构建索引并匹配完成对整个申请表内容的精准识别,同步写入数据库中,完成对数据的识别存档。该识别方法快捷高效,可以有效提高办公效率。
-
公开(公告)号:CN114565748A
公开(公告)日:2022-05-31
申请号:CN202210087400.5
申请日:2022-01-25
Applicant: 中通服咨询设计研究院有限公司 , 江苏省通信服务有限公司
Abstract: 本发明公开了一种粗精双模型进出口货物申请表OCR识别方法,包括以下步骤:步骤1,粗模型表头内容匹配定位识别,通过Tesseract‑OCR算法对表头内容进行识别并与制表数据库中的模板信息进行快速匹配,得到整张申请表的行列数和关键字段信息;步骤2,表格内容图像预处理,通过中值滤波和图像锐化操作过滤图像的噪点信息,同时结合阈值分割去除红色印章信息;步骤3,表格cell内容识别以及识别后处理,利用改进的TE‑Efficient算法和CRNN轻量检测网络结构对表格cell小目标特征提取与识别。构建索引并匹配完成对整个申请表内容的精准识别,同步写入数据库中,完成对数据的识别存档。该识别方法快捷高效,可以有效提高办公效率。
-