-
公开(公告)号:CN112818785B
公开(公告)日:2022-01-11
申请号:CN202110090678.3
申请日:2021-01-22
Applicant: 国家气象信息中心(中国气象局气象数据中心)
Abstract: 本发明提供了一种气象纸质表格文档的快速数字化方法及系统,属于气象数据处理领域。所述快速数字化方法包括:获取气象纸质表格文档的图像;对图像进行预处理后,提取表格线并进行字符识别,完成对字符的提取和定位,存储为第一类字符;对处理完的表格文档图像进行切割,对每个子图像进行文字录入;将录入的文字对第一类字符进行定位匹配及校验;校验通过时,存储字符;校验不通过时,丢弃字符,以当前子图像作为表格文档图像,转入预处理;遍历所有子图像且校验通过时,输出所有字符作为数字化结果。本发明实现了气象表格文档的快速数字化,简化了基于语义分割的文字检测,实现了对包含印刷和手写字符的表格文档高精度、高准确度的字符提取。
-
公开(公告)号:CN112818785A
公开(公告)日:2021-05-18
申请号:CN202110090678.3
申请日:2021-01-22
Applicant: 国家气象信息中心(中国气象局气象数据中心)
Abstract: 本发明提供了一种气象纸质表格文档的快速数字化方法及系统,属于气象数据处理领域。所述快速数字化方法包括:获取气象纸质表格文档的图像;对图像进行预处理后,提取表格线并进行字符识别,完成对字符的提取和定位,存储为第一类字符;对处理完的表格文档图像进行切割,对每个子图像进行文字录入;将录入的文字对第一类字符进行定位匹配及校验;校验通过时,存储字符;校验不通过时,丢弃字符,以当前子图像作为表格文档图像,转入预处理;遍历所有子图像且校验通过时,输出所有字符作为数字化结果。本发明实现了气象表格文档的快速数字化,简化了基于语义分割的文字检测,实现了对包含印刷和手写字符的表格文档高精度、高准确度的字符提取。
-