一种气象纸质表格文档的快速数字化方法及系统

    公开(公告)号:CN112818785B

    公开(公告)日:2022-01-11

    申请号:CN202110090678.3

    申请日:2021-01-22

    Abstract: 本发明提供了一种气象纸质表格文档的快速数字化方法及系统,属于气象数据处理领域。所述快速数字化方法包括:获取气象纸质表格文档的图像;对图像进行预处理后,提取表格线并进行字符识别,完成对字符的提取和定位,存储为第一类字符;对处理完的表格文档图像进行切割,对每个子图像进行文字录入;将录入的文字对第一类字符进行定位匹配及校验;校验通过时,存储字符;校验不通过时,丢弃字符,以当前子图像作为表格文档图像,转入预处理;遍历所有子图像且校验通过时,输出所有字符作为数字化结果。本发明实现了气象表格文档的快速数字化,简化了基于语义分割的文字检测,实现了对包含印刷和手写字符的表格文档高精度、高准确度的字符提取。

    一种气象纸质表格文档的快速数字化方法及系统

    公开(公告)号:CN112818785A

    公开(公告)日:2021-05-18

    申请号:CN202110090678.3

    申请日:2021-01-22

    Abstract: 本发明提供了一种气象纸质表格文档的快速数字化方法及系统,属于气象数据处理领域。所述快速数字化方法包括:获取气象纸质表格文档的图像;对图像进行预处理后,提取表格线并进行字符识别,完成对字符的提取和定位,存储为第一类字符;对处理完的表格文档图像进行切割,对每个子图像进行文字录入;将录入的文字对第一类字符进行定位匹配及校验;校验通过时,存储字符;校验不通过时,丢弃字符,以当前子图像作为表格文档图像,转入预处理;遍历所有子图像且校验通过时,输出所有字符作为数字化结果。本发明实现了气象表格文档的快速数字化,简化了基于语义分割的文字检测,实现了对包含印刷和手写字符的表格文档高精度、高准确度的字符提取。

Patent Agency Ranking