字符级文本检测模型的训练方法及装置、介质、终端

    公开(公告)号:CN115937870A

    公开(公告)日:2023-04-07

    申请号:CN202111159043.0

    申请日:2021-09-30

    Abstract: 一种字符级文本检测模型的训练方法及装置、介质、终端,方法包括:在第k次迭代过程中,采用第k‑1次迭代得到的文本检测模型对业务候选数据集中的各个样本的增强样本集合进行推断,得到预测框集合;计算样本的预测结果一致性指数;根据各个样本的预测结果一致性指数,选取目标样本;将人工单词级标注后的目标样本加入选中样本集,用第k‑1次迭代得到的文本检测模型对目标样本进行推断得到字符级伪标签,基于标注的目标样本及其字符级伪标签对第k‑1次迭代得到的文本检测模型进行训练,得到第k次迭代的文本检测模型;对第k次迭代得到的文本检测模型进行评估,若评估通过,得到字符级文本检测模型。上述方案能够降低标注耗时以及标注成本。

Patent Agency Ranking