一种基于PaddleOCR的复杂背景图像文字检测与增强系统及方法

    公开(公告)号:CN119625743A

    公开(公告)日:2025-03-14

    申请号:CN202411715465.5

    申请日:2024-11-27

    Applicant: 南通大学

    Abstract: 本发明涉及图像文字处理技术领域,尤其涉及一种基于PaddleOCR的复杂背景图像文字检测与增强系统及方法,包括:通过批量读取指定目录下的图像文件,利用PaddleOCR模型进行初步文字检测与识别,提取文字边界框及其对应的文字内容,并计算每个文字的中心位置。基于初步识别结果,系统进一步分析字符特征,包括平均字符宽度、平均字符高度及字符间距,以推测图像中可能存在但未被初步识别的文字区域位置。对于预测的潜在文字区域,系统进行图像增强处理,对比度增强和直方图均衡化,并再次应用OCR模型进行文字识别,持续补充新的识别结果。本发明显著提升了OCR的识别率和处理效果,适用于复杂背景、商品包装、食品检测机构成分识别等。

Patent Agency Ranking