-
公开(公告)号:CN114581905B
公开(公告)日:2024-08-16
申请号:CN202210375908.5
申请日:2022-04-11
Applicant: 华南理工大学
IPC: G06V20/62 , G06F40/30 , G06N3/044 , G06N3/0464 , G06N3/0455 , G06V30/19
Abstract: 本发明公开一种基于语义增强机制的场景文本识别方法及系统,包括获取场景文本图像,对场景文本图像进行校正,对校正后的场景文本图像进行特征提取,获取视觉特征,基于视觉特征提取全局语义信息,基于全局语义信息,对视觉特征进行解码转录,得到场景文本识别字符串结果。通过上述技术方案,本发明使场景文本图像的识别能够更加准确。
-
公开(公告)号:CN114581905A
公开(公告)日:2022-06-03
申请号:CN202210375908.5
申请日:2022-04-11
Applicant: 华南理工大学
Abstract: 本发明公开一种基于语义增强机制的场景文本识别方法及系统,包括获取场景文本图像,对场景文本图像进行校正,对校正后的场景文本图像进行特征提取,获取视觉特征,基于视觉特征提取全局语义信息,基于全局语义信息,对视觉特征进行解码转录,得到场景文本识别字符串结果。通过上述技术方案,本发明使场景文本图像的识别能够更加准确。
-
公开(公告)号:CN113723423A
公开(公告)日:2021-11-30
申请号:CN202111039925.3
申请日:2021-09-06
Applicant: 华南理工大学
Abstract: 本发明公开了一种基于渐进矫正机制的场景文本识别方法,包括:采集场景文本图像,将所述场景文本图像进行渐进式矫正,获得目标文本图像,基于所述目标文本图像进行文本识别,获得识别结果。本发明通过采用一种渐进的矫正机制将不规则文本矫正为规则文本,并将其准确识别,能够消除拍摄角度带来的透视变形和字符的不规则排列带来的弯曲性等形变,同时剔除或抑制复杂背景带来的干扰,解决了包含不规则文本的场景识别问题,大大提高了识别系统对场景文本的鲁棒性,从而进一步提升了识别效果。
-
公开(公告)号:CN113723330B
公开(公告)日:2023-11-07
申请号:CN202111039933.8
申请日:2021-09-06
Applicant: 华南理工大学
IPC: G06V30/412 , G06V30/413 , G06V30/19 , G06V10/82 , G06N3/0464 , G06V10/80 , G06T5/30 , G06F40/30 , G06V10/764
Abstract: 本发明公开了一种图表文档信息理解的方法及系统,包括:采集初始图表文档,对所述初始图表文档进行分类,获得第一图表文档;对所述第一图表文档进行文本检测和识别,获得第二图表文档;对所述第二图表文档进行文本属性分类,获得目标图表文档;基于所述目标图表文档实现对图表文档信息的理解。本发明提出的图表文档信息理解的方法及系统,可以有效对图表文档进行分类,文本检测和识别,以及文本属性分类,对于机器自动化提取、分析、理解图表文档内容信息有重大的作用和意义。
-
公开(公告)号:CN113723330A
公开(公告)日:2021-11-30
申请号:CN202111039933.8
申请日:2021-09-06
Applicant: 华南理工大学
Abstract: 本发明公开了一种图表文档信息理解的方法及系统,包括:采集初始图表文档,对所述初始图表文档进行分类,获得第一图表文档;对所述第一图表文档进行文本检测和识别,获得第二图表文档;对所述第二图表文档进行文本属性分类,获得目标图表文档;基于所述目标图表文档实现对图表文档信息的理解。本发明提出的图表文档信息理解的方法及系统,可以有效对图表文档进行分类,文本检测和识别,以及文本属性分类,对于机器自动化提取、分析、理解图表文档内容信息有重大的作用和意义。
-
-
-
-