-
公开(公告)号:CN117456538A
公开(公告)日:2024-01-26
申请号:CN202311414531.0
申请日:2023-10-27
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V30/19
Abstract: 本说明书实施例涉及一种训练文字识别模型的方法及装置,方法包括:首先,将第一训练集中的任一目标图像输入到第一文字识别模型中,得到对于目标图像中各个字符属于特定字符类别的预测结果。然后,对于目标字符类别,根据预测结果中属于目标字符类别的第一字符数量,以及属于目标字符类别并且置信度大于第一阈值的第二字符数量,确定目标字符类别对应的目标学习状态值。接下来,根据目标学习状态值与第一阈值,确定目标字符类别对应的目标类别阈值。然后,确定属于目标字符类别并且置信度大于目标类别阈值的目标字符,并将目标字符类别作为目标字符的标签,形成第二训练集。最后,基于第二训练集,对第二文字识别模型进行训练。
-
公开(公告)号:CN115862015A
公开(公告)日:2023-03-28
申请号:CN202211247962.8
申请日:2022-10-12
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V30/10 , G06V30/19 , G06N3/0464 , G06N3/08
Abstract: 本说明书实施例提供一种文字识别系统的训练方法及装置,其中文字识别系统包括图像表征网络、字符对齐网络和字符分类器。该方法包括:利用数据增广模块对包含标签文本的原始图像进行场景渲染处理,得到增广图像;利用图像表征网络分别处理原始图像和增广图像,对应得到原图表征和增广图表征;利用字符对齐网络分别处理原图表征和增广图表征,分别得到与标签文本中各个字符对应的第一字符表征和第二字符表征;利用字符分类器处理第一字符表征,形成第一预测文本;利用字符对比模块处理第一字符表征和第二字符表征,得到对应相同字符的正表征对和对应不同字符的负表征对;基于第一预测文本、标签文本、正表征对和负表征对,训练文字识别系统。
-