-
公开(公告)号:CN115937875A
公开(公告)日:2023-04-07
申请号:CN202111161555.0
申请日:2021-09-30
Applicant: 上海复旦微电子集团股份有限公司
IPC: G06V30/40 , G06V30/413 , G06V30/19 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 一种文本识别方法及装置、存储介质、终端,所述方法还包括:获取多个随机文本内容和属性特征信息;根据所述多个随机文本内容和所述属性特征信息,生成图像样本集,其中,所述图像样本集包括多张文本图像;采用图像样本集对预设模型进行训练,以得到文本识别模型;采用所述文本识别模型对待识别图像进行识别,以确定所述待识别图像中的识别结果,其中,所述待识别图像为所述目标场景下的图像。通过本发明的方案,可以提高文本识别的准确率。
-
公开(公告)号:CN115937870A
公开(公告)日:2023-04-07
申请号:CN202111159043.0
申请日:2021-09-30
Applicant: 上海复旦微电子集团股份有限公司
Abstract: 一种字符级文本检测模型的训练方法及装置、介质、终端,方法包括:在第k次迭代过程中,采用第k‑1次迭代得到的文本检测模型对业务候选数据集中的各个样本的增强样本集合进行推断,得到预测框集合;计算样本的预测结果一致性指数;根据各个样本的预测结果一致性指数,选取目标样本;将人工单词级标注后的目标样本加入选中样本集,用第k‑1次迭代得到的文本检测模型对目标样本进行推断得到字符级伪标签,基于标注的目标样本及其字符级伪标签对第k‑1次迭代得到的文本检测模型进行训练,得到第k次迭代的文本检测模型;对第k次迭代得到的文本检测模型进行评估,若评估通过,得到字符级文本检测模型。上述方案能够降低标注耗时以及标注成本。
-