融合边缘信息与文本增强的越南语场景文本检测方法及装置

    公开(公告)号:CN118762356A

    公开(公告)日:2024-10-11

    申请号:CN202410861066.3

    申请日:2024-06-28

    Inventor: 文益民 蒋理玉

    Abstract: 本发明公开一种融合边缘信息与文本增强的越南语场景文本检测方法及装置,该方法步骤包括:S01.将待测图像输入至主干网络提取出多层特征,以及由EIEM模块基于通道注意力机制提取得到边缘细节信息,将文本边缘细节信息与第一层特征融合;S02.将从主干网络中提取出的顶层特征输入至TREM模块,分别提取全局上下文信息以及字符间的依赖关系,根据TREM模块输出的特征对从主干网络提取出的各层特征进行调节,融合不同层的特征图形成文本区域增强后的特征图;S03.进行文本后处理,得到概率图和自适应阈值图,进行可变二值化操作,得到近似二值图以确定文本框的边界。本发明具有实现方法简单、检测精度高且鲁棒性强等优点。

Patent Agency Ranking