基于深度学习的文档图像形状校正方法及系统

    公开(公告)号:CN117975469A

    公开(公告)日:2024-05-03

    申请号:CN202410163594.1

    申请日:2024-02-05

    Applicant: 重庆大学

    Abstract: 本发明属于文档校正技术领域,具体公开了一种基于深度学习的文档图像形状校正方法及系统,该方法包括如下步骤:S1,获取输入文档图像并输入前处理网络,得到文档mask图像;S2,文档mask图像与原输入文档图像进行点乘,得到去除背景的文档图像;S3,去除背景的文档图像作为编码器网络的输入,得到包含丰富几何失真的特征图;S4,将包含丰富几何失真的特征图输入解码器网络和空洞卷积金字塔模块,得到文本行mask预测图和控制点坐标图;S5,基于控制点坐标图中的控制点在原始图像上采用TPS插值方法,得到最终的校正图像。采用本技术方案,去除背景像素对图像校正产生的影响,关注文本内容的细微变形,提高校正的准确性和鲁棒性。

Patent Agency Ranking