-
公开(公告)号:CN114863457B
公开(公告)日:2025-03-11
申请号:CN202110152434.3
申请日:2021-02-03
Applicant: 哈尔滨工业大学(深圳)
IPC: G06V30/414 , G06V30/18 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种自然场景中购物票据图像的光学字符识别方法,该方法包括使用文本检测模块对原始图像进行区域检测获取票据文本图,以及使用文本识别模块对票据文本图进行文本识别。文本检测模块设置有显著性物体检测和文本检测至少两个任务,文本识别模块设置有基于Transformer的注意力模块。本发明公开的技术方案通过多任务模型的建立减少数据的过拟合,提高检测速度,通过基于Transformer的注意力模块将对齐过程和预测过程解耦,加快了推理速度并提高了文本识别精度。
-
公开(公告)号:CN114863457A
公开(公告)日:2022-08-05
申请号:CN202110152434.3
申请日:2021-02-03
Applicant: 哈尔滨工业大学(深圳)
IPC: G06V30/414 , G06V30/18 , G06V10/764 , G06V10/82 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种自然场景中购物票据图像的光学字符识别方法,该方法包括使用文本检测模块对原始图像进行区域检测获取票据文本图,以及使用文本识别模块对票据文本图进行文本识别。文本检测模块设置有显著性物体检测和文本检测至少两个任务,文本识别模块设置有基于Transformer的注意力模块。本发明公开的技术方案通过多任务模型的建立减少数据的过拟合,提高检测速度,通过基于Transformer的注意力模块将对齐过程和预测过程解耦,加快了推理速度并提高了文本识别精度。
-