-
公开(公告)号:CN117727039A
公开(公告)日:2024-03-19
申请号:CN202311746693.4
申请日:2023-12-19
Applicant: 用友网络科技股份有限公司
IPC: G06V30/146 , G06V30/18 , G06V30/19 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于多任务学习的文档图像校正方法和装置,该方法包括:文档图像输入、文档分类、目标检测、关键点定位、四方向分类、畸变校正、角度校正、输出结果;本发明还公开了一种基于多任务学习的文档图像校正模型训练方法和装置,该方法包括:文档图像训练数据采集、输入数据预处理、Backbone特征提取、Neck特征融合、Head输出,还包括损失函数确定。本发明利用多任务学习方法,将目标检测、关键点定位、四方向分类和文档分类结合在一起,共同完成文档图像校正任务,其在解决文档图像因拍摄和扫描过程导致的旋转、倾斜和畸变的问题时,可以实现任务之间的信息和特征共享,提高模型效率,提升校正性能,提升后续任务的准确度,具有准确高效的特点。