-
公开(公告)号:CN113516126A
公开(公告)日:2021-10-19
申请号:CN202110750847.1
申请日:2021-07-02
Applicant: 成都信息工程大学
IPC: G06K9/32 , G06K9/34 , G06K9/38 , G06K9/46 , G06K9/62 , G06N3/04 , G06N3/08 , G06T7/13 , G06T7/136
Abstract: 本发明涉及一种基于注意力特征融合的自适应阈值场景文本检测方法,包括,通过设备捕捉场景图片,将场景图片输入到构建好的神经网络中,神经网络包括三个处理模块;特征提取模块用于对图片进行特征提取,其中卷积层加入的通道注意力模块能够动态调制图片各通道的权重,通过增强文本特征权重来提高网络的表示能力,特征融合将特征提取模块中下采样得到的不同尺度的的特征进行金字塔方式的特征融合,融合了低层特征的高分辨率和高层特征的语义信息,提高了分割的鲁棒性。图像分割模块是将特征融合模块得到的特征进行预测得到概率图和阈值图,在通过网络中学习概率图像素的最佳阈值,最后在概率图上利用最佳阈值生成最佳二值图,得到检测的文本区域。