-
公开(公告)号:CN117237968A
公开(公告)日:2023-12-15
申请号:CN202311025547.2
申请日:2023-08-15
Applicant: 中国科学院信息工程研究所
IPC: G06V30/412 , G06V30/18 , G06V30/19 , G06V10/82 , G06N3/0455
Abstract: 本发明提出了一种基于Transformer的逐行扫描的表格结构识别方法及系统,涉及表格图像识别领域。本发明设计一个全新的表格结构识别模型,由编码器模块、行解码器模块和单元格解码器模块组成,结合表格本身独有的特性,按照符合表格逻辑的二维形式进行解码;同时通过使用半自回归形式生成表格序列,从而在一定程度上缓解较长的表格序列所带来的严重的误差累计问题。