-
公开(公告)号:CN113723330B
公开(公告)日:2023-11-07
申请号:CN202111039933.8
申请日:2021-09-06
Applicant: 华南理工大学
IPC: G06V30/412 , G06V30/413 , G06V30/19 , G06V10/82 , G06N3/0464 , G06V10/80 , G06T5/30 , G06F40/30 , G06V10/764
Abstract: 本发明公开了一种图表文档信息理解的方法及系统,包括:采集初始图表文档,对所述初始图表文档进行分类,获得第一图表文档;对所述第一图表文档进行文本检测和识别,获得第二图表文档;对所述第二图表文档进行文本属性分类,获得目标图表文档;基于所述目标图表文档实现对图表文档信息的理解。本发明提出的图表文档信息理解的方法及系统,可以有效对图表文档进行分类,文本检测和识别,以及文本属性分类,对于机器自动化提取、分析、理解图表文档内容信息有重大的作用和意义。
-
公开(公告)号:CN116468759A
公开(公告)日:2023-07-21
申请号:CN202310258553.6
申请日:2023-03-16
Applicant: 华南理工大学
IPC: G06T7/33 , G06T7/13 , G06N3/0464 , G06N3/0442
Abstract: 本发明公开了一种适用于拍照文档的图像配准方法、系统、装置及介质,其中方法包括:获取拍照文档图像,对所述拍照文档图像进行非刚性预对齐,获得预对齐文档图像;获取干净文档图像,对所述干净文档图像和预对齐文档图像进行分层对齐,获得多尺度特征图和偏移场;对所述多尺度特征图和偏移场进行细粒度循环细化,获得与所述预对齐文档图像相同尺度大小的偏移场。本发明能够处理具有不同干扰因素的拍照文档图像,包括纸张扭曲、纸张褶皱、拍摄光照变化或者阴影变化的情况。本发明可广泛应用于模式识别与人工智能技术领域。
-
公开(公告)号:CN115359501A
公开(公告)日:2022-11-18
申请号:CN202210900596.5
申请日:2022-07-28
Applicant: 华南理工大学
IPC: G06V30/412 , G06V30/14 , G06V30/19 , G06V10/26 , G06V10/774
Abstract: 本发明公开了一种表格数据增强方法、表格识别方法、装置及存储介质,其中表格数据增强方法包括:获取表格图片数据,对表格图片数据进行标注,获得标注信息;根据所述标注信息计算并生成表格的行标识矩阵和列标识矩阵;根据生成的标识矩阵获取表格的可切割位置,根据可切割位置对表格图片进行切割;将切割出来的每个表格图片的特征进行更正,获得增强的表格图片数据。本发明可以从一张表格上获取多个表格数据,不会破坏表格本身的结构,实现高质量的数据增强,对于现存的稀缺但又难以扩充的表格数据具有重大的意义;且适用于各种类型的表格,尤其是具有跨行跨列单元格的复杂表格。本发明可广泛应用于计算机视觉领域和表格识别领域。
-
公开(公告)号:CN113723330A
公开(公告)日:2021-11-30
申请号:CN202111039933.8
申请日:2021-09-06
Applicant: 华南理工大学
Abstract: 本发明公开了一种图表文档信息理解的方法及系统,包括:采集初始图表文档,对所述初始图表文档进行分类,获得第一图表文档;对所述第一图表文档进行文本检测和识别,获得第二图表文档;对所述第二图表文档进行文本属性分类,获得目标图表文档;基于所述目标图表文档实现对图表文档信息的理解。本发明提出的图表文档信息理解的方法及系统,可以有效对图表文档进行分类,文本检测和识别,以及文本属性分类,对于机器自动化提取、分析、理解图表文档内容信息有重大的作用和意义。
-
公开(公告)号:CN110233667A
公开(公告)日:2019-09-13
申请号:CN201910485565.6
申请日:2019-06-05
Applicant: 华南理工大学
IPC: H04B10/116 , G01C21/20 , H04N7/18
Abstract: 本发明公开了一种基于均值漂移与无迹卡尔曼滤波的VLC动态定位方法及系统,该方法包括以下步骤:首先,由LED驱动电路控制LED灯高频亮灭,通过LED-ID识别找到LED存在的区域、识别出LED的ID,并获得定位终端的初始位置。其次,均值移位算法和无迹卡尔曼滤波动态跟踪图像序列中的LED,计算当前帧LED与初始帧LED像素坐标的相对位置。然后,结合定位终端的初始位置与其在后续帧中的相对位置关系,获得定位终端在现实世界中的位置,实现实时性定位。本发明具有跟踪高速目标的能力,提高了LED被遮挡时的定位精度,即使一半的LED是屏蔽的,精度也可以保持。此外还具有良好的鲁棒性和实时性,在室内定位领域具有广阔的应用前景。
-
公开(公告)号:CN115083023B
公开(公告)日:2024-12-31
申请号:CN202210573892.9
申请日:2022-05-25
Applicant: 华南理工大学
IPC: G06V40/30 , G06V30/32 , G06V30/166 , G06V30/162 , G06V10/82 , G06N3/045 , G06N3/044 , G06N3/0475 , G06N3/088 , G06N3/094 , G06N3/096
Abstract: 本发明提供了一种笔画宽度可控的脱机签名图像生成方法,包括如下步骤:获得单像素轨迹图像和脱机签名图像,并对所述单像素轨迹图像和所述脱机签名图像进行预处理;计算预处理后的所述脱机签名图像的笔画宽度等级;构建并训练基于笔画宽度条件向量的循环生成对抗网络;基于训练后的所述基于笔画宽度条件向量的循环生成对抗网络,获得笔画宽度可控的脱机签名图像。本发明给出的模型可以自动生成大量形变自然的手写风格逼真的脱机签名图像,缓解了深度脱机签名认证领域训练数据不足的问题,具有较高的应用价值。
-
公开(公告)号:CN110233667B
公开(公告)日:2024-09-03
申请号:CN201910485565.6
申请日:2019-06-05
Applicant: 华南理工大学
IPC: H04B10/116 , G01C21/20 , H04N7/18
Abstract: 本发明公开了一种基于均值漂移与无迹卡尔曼滤波的VLC动态定位方法及系统,该方法包括以下步骤:首先,由LED驱动电路控制LED灯高频亮灭,通过LED‑ID识别找到LED存在的区域、识别出LED的ID,并获得定位终端的初始位置。其次,均值移位算法和无迹卡尔曼滤波动态跟踪图像序列中的LED,计算当前帧LED与初始帧LED像素坐标的相对位置。然后,结合定位终端的初始位置与其在后续帧中的相对位置关系,获得定位终端在现实世界中的位置,实现实时性定位。本发明具有跟踪高速目标的能力,提高了LED被遮挡时的定位精度,即使一半的LED是屏蔽的,精度也可以保持。此外还具有良好的鲁棒性和实时性,在室内定位领域具有广阔的应用前景。
-
公开(公告)号:CN115083023A
公开(公告)日:2022-09-20
申请号:CN202210573892.9
申请日:2022-05-25
Applicant: 华南理工大学
IPC: G06V40/30 , G06V30/32 , G06V30/166 , G06V30/162 , G06V10/82 , G06N3/04 , G06N3/08
Abstract: 本发明提供了一种笔画宽度可控的脱机签名图像生成方法,包括如下步骤:获得单像素轨迹图像和脱机签名图像,并对所述单像素轨迹图像和所述脱机签名图像进行预处理;计算预处理后的所述脱机签名图像的笔画宽度等级;构建并训练基于笔画宽度条件向量的循环生成对抗网络;基于训练后的所述基于笔画宽度条件向量的循环生成对抗网络,获得笔画宽度可控的脱机签名图像。本发明给出的模型可以自动生成大量形变自然的手写风格逼真的脱机签名图像,缓解了深度脱机签名认证领域训练数据不足的问题,具有较高的应用价值。
-
公开(公告)号:CN209949108U
公开(公告)日:2020-01-14
申请号:CN201920840596.4
申请日:2019-06-05
Applicant: 华南理工大学
IPC: H04B10/116 , G01C21/20 , H04N7/18
Abstract: 本实用新型公开了一种基于均值漂移与无迹卡尔曼滤波的VLC动态定位系统,包括VLC发射端、VLC接收端和服务器端,其中,所述的VLC发射端包括28V恒压源、LED驱动电路、LED灯和电源适配器;所述的VLC接收端包括定位终端和摄像头子系统;所述的服务器端包括图像处理子系统、图像跟踪模块和无迹卡尔曼滤波器。本实用新型具有跟踪高速目标的能力,提高了LED被遮挡时的定位精度,即使一半的LED是屏蔽的,精度也可以保持。此外还具有良好的鲁棒性和实时性,在室内定位领域具有广阔的应用前景。(ESM)同样的发明创造已同日申请发明专利
-
公开(公告)号:CN208386714U
公开(公告)日:2019-01-15
申请号:CN201820874507.3
申请日:2018-06-07
Applicant: 华南理工大学
IPC: H04N5/21 , H04N5/225 , H04N5/217 , H04B10/116
Abstract: 本实用新型公开了一种基于ITS-VLC的像素间干扰消除系统,包括:IPI消除发射子系统和IPI消除接收终端子系统,该IPI消除发射子系统包括:编码器、LED驱动电路和LED阵列,编码器、LED驱动电路和LED阵列依次连接,原始信息经过编码器编码之后,携带可见光信息的LED阵列的信息通过LED驱动电路,驱动LED阵列发射可见光信号;该IPI消除接收终端子系统包括:CMOS图像传感器、图像处理模块、IPI消除模块、最小均方误差滤波器和解码器,CMOS图像传感器、图像处理模块、IPI消除模块、最小均方误差滤波器和解码器依次连接。本实用新型提高了LED阵列的可见光通信距离,具有广阔的应用前景等优点。(ESM)同样的发明创造已同日申请发明专利
-
-
-
-
-
-
-
-
-