-
公开(公告)号:CN112861736A
公开(公告)日:2021-05-28
申请号:CN202110185627.9
申请日:2021-02-10
Applicant: 上海大学
Abstract: 本发明公开了一种基于图像处理的文献表格内容识别与信息提取方法,运用计算机图像检测方法,实现对文献表格图片进行的内容识别、信息提取和结构复原;首先读取一张表格图片,利用形态学方法去除表格框线;然后利用轮廓检测找出字符区域,将区域截取出来并保存;随后选取若干张字符块图片拼接成大图,调用文字识别模型识别大图上文字,解析并保存识别结果;最后读取字符块信息数据,按照基于字符块坐标的行发现与自适应列对齐复原算法,对表格进行复原,并保存到数据库;本发明文献中表格图片内容识别与信息提取方法能够实现框线去除、内容识别和结构复原,提高文献信息提取速度,为构建相应学科数据库提供一种方法,促进对应学科的研究和发展。
-
公开(公告)号:CN114332866B
公开(公告)日:2024-10-18
申请号:CN202111490372.3
申请日:2021-12-08
Applicant: 上海大学
IPC: G06V30/148 , G06V30/413
Abstract: 本发明公开了一种基于图像处理的文献曲线分离与坐标信息提取方法,运用计算机图像检测方法,实现对文献曲线图片进行分割与曲线信息提取;首先读取一张曲线图片,利用图像处理方法分割曲线图片;然后利用字符检测算法找出字符区域,并获取字符区域具体数值与位置信息;随后根据颜色提取曲线图上不同颜色的曲线,在将曲线图分离成单一的曲线图之后就便于计算曲线的坐标了;本发明文献中曲线分离与坐标信息提取方法能够实现坐标分割、内容识别和坐标提取,提高文献信息提取速度,为构建相应学科数据库提供一种方法,促进对应学科的研究和发展。
-
公开(公告)号:CN114332866A
公开(公告)日:2022-04-12
申请号:CN202111490372.3
申请日:2021-12-08
Applicant: 上海大学
IPC: G06V30/148 , G06V30/413
Abstract: 本发明公开了一种基于图像处理的文献曲线分离与坐标信息提取方法,运用计算机图像检测方法,实现对文献曲线图片进行分割与曲线信息提取;首先读取一张曲线图片,利用图像处理方法分割曲线图片;然后利用字符检测算法找出字符区域,并获取字符区域具体数值与位置信息;随后根据颜色提取曲线图上不同颜色的曲线,在将曲线图分离成单一的曲线图之后就便于计算曲线的坐标了;本发明文献中曲线分离与坐标信息提取方法能够实现坐标分割、内容识别和坐标提取,提高文献信息提取速度,为构建相应学科数据库提供一种方法,促进对应学科的研究和发展。
-
公开(公告)号:CN112861736B
公开(公告)日:2022-08-09
申请号:CN202110185627.9
申请日:2021-02-10
Applicant: 上海大学
IPC: G06V30/40 , G06V30/162 , G06F16/90
Abstract: 本发明公开了一种基于图像处理的文献表格内容识别与信息提取方法,运用计算机图像检测方法,实现对文献表格图片进行的内容识别、信息提取和结构复原;首先读取一张表格图片,利用形态学方法去除表格框线;然后利用轮廓检测找出字符区域,将区域截取出来并保存;随后选取若干张字符块图片拼接成大图,调用文字识别模型识别大图上文字,解析并保存识别结果;最后读取字符块信息数据,按照基于字符块坐标的行发现与自适应列对齐复原算法,对表格进行复原,并保存到数据库;本发明文献中表格图片内容识别与信息提取方法能够实现框线去除、内容识别和结构复原,提高文献信息提取速度,为构建相应学科数据库提供一种方法,促进对应学科的研究和发展。
-
-
-