-
公开(公告)号:CN116912857A
公开(公告)日:2023-10-20
申请号:CN202310829177.1
申请日:2023-07-07
Applicant: 北京华宇信息技术有限公司
IPC: G06V30/226 , G06V30/412 , G06V30/148 , G06V30/19 , G06N3/0464 , G06N3/084
Abstract: 本申请提供一种手写体和印刷体文本分离方法及装置,用以解决手写体文本和印刷体文本相近的情况下文本框左右粘连,造成文本区域分离错误的技术问题。具体的,一种手写体和印刷体文本分离方案,通过使用卷积神经网络预测不同的字体类型特征图,根据不同的字体类型特征图对字体类型进行预测,提高了预测准确率和泛用性。通过在标签文本区域框两端,生成以标签文本区域框的高度为直径的高斯图,根据高斯图生成边界框,通过实际文本区域框中存在两个以上边界区域框,认定实际文本区域框要分离,进而确定手写体和印刷体文本框的边界,降低了由于不同文本区域框左右粘连导致文本区域框分离错误的概率,提高了手写体文本和印刷体文本分离的准确度。
-
公开(公告)号:CN110766008A
公开(公告)日:2020-02-07
申请号:CN201911034756.7
申请日:2019-10-29
Applicant: 北京华宇信息技术有限公司
Abstract: 本发明提供一种面向任意方向和形状的文本检测方法,包括人工合成数据训练阶段、弱监督训练阶段和测试阶段,针对有字符标注框的原始数据图像采用人工合成数据训练阶段进行训练,针对只有词级标注框没有字符标注框的原始数据图像,采用弱监督训练阶段进行训练。本发明可以更好的检测目标较大的文本。同时,在后置处理时对检测到的相邻较近的文本框进行连接操作,有效的减少了文本检测的间断问题。
-