一种基于频率分离的图像文本分割方法

    公开(公告)号:CN119672727A

    公开(公告)日:2025-03-21

    申请号:CN202411823669.0

    申请日:2024-12-12

    Inventor: 戚金清 凌志华

    Abstract: 本发明属于计算机视觉领域中的图像文本分割领域,公开了一种基于频率分离的图像文本分割方法。先用CNN和Transformer来分别构建局部特征编码分支和全局特征编码分支,初步提取来自图像的局部特征和全局特征。在频率特征增强模块中,先使用小波变换来分解输入特征的频率。然后对得到的高频分量和低频分量,使用不同的策略进行增强。最后,利用低频信息引导网络关注文本区域附近的局部特征,减少无关背景噪声对分割结果的影响,最终获得精确的分割结果。本发明解决了图像文本分割任务中对文本检测模型的依赖,经该方法输出的结果具有高度完整性和精确性。

Patent Agency Ranking