-
公开(公告)号:CN116912857A
公开(公告)日:2023-10-20
申请号:CN202310829177.1
申请日:2023-07-07
Applicant: 北京华宇信息技术有限公司
IPC: G06V30/226 , G06V30/412 , G06V30/148 , G06V30/19 , G06N3/0464 , G06N3/084
Abstract: 本申请提供一种手写体和印刷体文本分离方法及装置,用以解决手写体文本和印刷体文本相近的情况下文本框左右粘连,造成文本区域分离错误的技术问题。具体的,一种手写体和印刷体文本分离方案,通过使用卷积神经网络预测不同的字体类型特征图,根据不同的字体类型特征图对字体类型进行预测,提高了预测准确率和泛用性。通过在标签文本区域框两端,生成以标签文本区域框的高度为直径的高斯图,根据高斯图生成边界框,通过实际文本区域框中存在两个以上边界区域框,认定实际文本区域框要分离,进而确定手写体和印刷体文本框的边界,降低了由于不同文本区域框左右粘连导致文本区域框分离错误的概率,提高了手写体文本和印刷体文本分离的准确度。