Patent search ap:("南京理工大学") AND inv:"张泓" Page 1

1.

发明公开
基于深度学习的图片型档案中文表格识别方法审中-实审

公开(公告)号：CN119049074A

公开(公告)日：2024-11-29

申请号：CN202411054787.X

申请日：2024-08-02

Applicant: 南京理工大学

Inventor： 张泓 , 朱佳雯 , 徐建

IPC: G06V30/413 , G06V30/414 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/082

Abstract: 本发明公开了一种基于深度学习的图片型档案中文表格识别方法，涉及中文表格识别领域，该方法包括：对档案中文表格图片的表格结构进行识别，根据识别结果获取用HTML语言表示的表格结构序列以及单元格四点坐标；设计PA‑FPN模型检测单元格内文本行四点坐标，对每个所述单元格内的文本行取最小外接矩形轮廓；根据文本行四点坐标对原始表格图片进行裁剪后，通过卷积递归神经网络对每个裁剪后的文本行图片进行文本识别，得到文本字符串；根据聚合规则，将所述的表格结构序列、单元格坐标、文本行坐标及其内容进行聚合输出，生成完整的由HTML语言表示的表格文件。本发明能够有效提高对档案中文表格单元格内文本行检测的精确度。

Patent Agency Ranking