-
公开(公告)号:CN114596559A
公开(公告)日:2022-06-07
申请号:CN202210250908.2
申请日:2022-03-15
Applicant: 重庆邮电大学
IPC: G06V20/62 , G06V30/148 , G06N3/04 , G06N3/08
Abstract: 本发明设计了一种基于GR和对抗学习的弱监督曲面文本检测方法,具体流程如图1所示,该方法主要将GR模型生成的显著图与基于对抗学习的弱监督曲面文本检测算法生成的黑白场景文本分割图进行逐像素特征融合得到最终的候选文本区域,利用两者检测的重点关注目标不同使得两者融合后的候选区域很大程度上会包含更全面的文本信息。本发明能够基于现有的曲面场景文本分割算法存在的局限性,分析存在的问题,从而使用户能够更准确的定位曲面目标表面的文本,从而为后续的文本区域分类工作提供更好的数据支撑,满足了用户的识别需求,提高了识别的准确率,从而使用户能够享受更便捷的生活。
-
公开(公告)号:CN114612913A
公开(公告)日:2022-06-10
申请号:CN202210251062.4
申请日:2022-03-15
Applicant: 重庆邮电大学
Abstract: 本发明设计了一种基于语义增强的曲面场景文本识别方法,具体流程如图1所示,该方法主要包含了投影变换子网络、编码器、解码器、语义模块和单词嵌入监督模块,本发明可以通过在注意力机制的编解码框架中引入全局语义信息与局部语义信息,将编码器输出的预测全局与局部语义信息输入到解码器,并使用预训练的语言模型的单词嵌入作为监督来提高性能,识别在光照不均匀和字符不完整情况下的曲面场景文本。本发明能够基于现有的曲面场景文本识别算法存在的局限性,分析存在的问题,从而使用户能够更准确的提取曲面目标表面的文本,满足了用户的识别需求,提高了识别的准确率,从而使用户能够享受更便捷的生活。
-