基于自蒸馏的半监督文本识别方法

    公开(公告)号:CN117746449A

    公开(公告)日:2024-03-22

    申请号:CN202211103799.8

    申请日:2022-09-09

    Applicant: 复旦大学

    Abstract: 本发明提供了一种基于自蒸馏的半监督文本识别方法,包括:步骤S1‑1,将待识别文本图像经过预处理得到预处理文本图像;步骤S1‑2,将预处理文本图像输入预先训练好的文本识别模型进行推理,迭代地得到文本行中每一个位置的行文本识别结果;步骤S1‑3,对行文本识别结果中进行字符拼接得到最终的文本识别结果,其中,文本识别模型的训练过程包括监督学习训练阶段以及基于半监督学习框架进行的半监督学习训练阶段。因此本发明提供的基于自蒸馏的半监督文本识别方法在半监督学习框架的基础上实现了利用无标签数据的半监督学习,并通过基于注意力对齐的自蒸馏算法实现了效果更好、更加稳定的半监督学习。

Patent Agency Ranking