-
公开(公告)号:CN119672727A
公开(公告)日:2025-03-21
申请号:CN202411823669.0
申请日:2024-12-12
Applicant: 大连理工大学
IPC: G06V30/148 , G06V30/18 , G06V30/186 , G06V30/19 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/084 , G06N3/09
Abstract: 本发明属于计算机视觉领域中的图像文本分割领域,公开了一种基于频率分离的图像文本分割方法。先用CNN和Transformer来分别构建局部特征编码分支和全局特征编码分支,初步提取来自图像的局部特征和全局特征。在频率特征增强模块中,先使用小波变换来分解输入特征的频率。然后对得到的高频分量和低频分量,使用不同的策略进行增强。最后,利用低频信息引导网络关注文本区域附近的局部特征,减少无关背景噪声对分割结果的影响,最终获得精确的分割结果。本发明解决了图像文本分割任务中对文本检测模型的依赖,经该方法输出的结果具有高度完整性和精确性。