一种感知多域字符距离的场景文本超分辨率方法

    公开(公告)号:CN117974443A

    公开(公告)日:2024-05-03

    申请号:CN202410129187.9

    申请日:2024-01-30

    Applicant: 福州大学

    Abstract: 本发明涉及一种感知多域字符距离的场景文本超分辨率方法。本发明设计了增强位置编码和多域字符距离感知模块,使其能够更加适应低分辨率文本图像的超分辨率任务。在视觉特征提取网络的设计上,本发明提出了一种非对称卷积特征提取模块,以较低的计算成本提高了整体网络对多方向以及弯曲文本图像的特征提取能力。本发明使用真实场景下的场景文本超分辨率数据集,将数据集通过数据增强手段处理后送入深度特征提取网络分支提取得到获得语义和视觉的特征信息以及增强位置编码,经过多域字符距离感知对齐网络获得文本图像超分引导信息,结合视觉特征以及引导线索通过图像重建模块输出得到分辨率高、可读性强的超分辨率文本图像。

Patent Agency Ranking