-
公开(公告)号:CN211108036U
公开(公告)日:2020-07-28
申请号:CN201921539660.1
申请日:2019-09-16
Applicant: 华南理工大学 , 华南理工大学珠海现代产业创新研究院
Abstract: 本实用新型公开了一种无人机机载二自由度增稳云台机构及无人机,该云台机构包括上支承板、定位孔、减震球体、下支承板、连接臂倒U型支架、两根左侧对称连接臂、两根右侧对称连接臂、横滚角调节舵机U型支架、俯仰角调节舵机U型支架、横滚角调节舵机、俯仰角调节舵机、横滚角调节舵机侧部倒左U型支架、横滚角调节舵机底部倒U型支架、俯仰角调节舵机顶部U型支架、俯仰角调节舵机底部倒U型支架、摄像机平台U型支架、摄像机以及角度控制单元。本实用新型的云台机构可以实现俯仰角和横滚角的二自由度角度调整,并且减震效果良好。(ESM)同样的发明创造已同日申请发明专利
-
公开(公告)号:CN119625753A
公开(公告)日:2025-03-14
申请号:CN202411671924.4
申请日:2024-11-21
Applicant: 华南理工大学
IPC: G06V30/19 , G06V30/146 , G06V30/18 , G06V30/182 , G06V10/82 , G06N3/0464 , G06N3/0455 , G06N3/088 , G06N3/0895
Abstract: 本发明属于模式识别与人工智能领域,公开了一种基于对比学习和视觉表意描述序列的甲骨字破译方法及系统,所述方法包括:使用训练好的甲骨文部件识别器对输入的待破译甲骨字图像部件进行特征提取,得到甲骨字图像视觉嵌入特征;使用视觉编码器对输入的待破译甲骨字图像和现代汉字集提取整体视觉特征,得到甲骨字整体视觉特征和汉字整体视觉特征;使用基于IDS互询的特征增强器对所述甲骨字图像视觉嵌入特征和甲骨字整体视觉特征、汉字图像视觉嵌入特征和汉字整体视觉特征进行表征增强,得到甲骨字增强特征和汉字增强特征;使用对比学习对所述甲骨字增强特征和所述汉字增强特征进行对比计算,得到对比向量,基于所述对比向量得到甲骨文破译结果。
-
公开(公告)号:CN114967972B
公开(公告)日:2025-01-14
申请号:CN202210449982.7
申请日:2022-04-27
Applicant: 华南理工大学
IPC: G06F3/041
Abstract: 本发明公开一种触摸屏采样率的调整方法、系统、装置及存储介质,方法包括:创建曲线类,所述曲线类包括源点、终点和控制点,所述源点、所述终点和所述控制点用于对曲线轨迹进行更新,控制点用于记录因触摸屏发生触碰产生的轨迹点;确定当前所述控制点和上一个所述控制点之间的欧几里得距离,并根据所述欧几里得距离确定采样点的数量;根据曲线轨迹以及所述采样点的数量确定所述采样点的信息。本发明通过确定相邻的控制点之间的欧几里得距离,来确定当前曲线轨迹上采样点的数量,并完成曲线轨迹的采样,这些采样点是系统原生API无法记录到的,从而提高了安卓设备的采样率,而且保证采样点的真实有效性。本发明可广泛应用于终端技术领域内。
-
公开(公告)号:CN118840788A
公开(公告)日:2024-10-25
申请号:CN202410846535.4
申请日:2024-06-27
Applicant: 华南理工大学
Abstract: 本发明公开了一种文本无关联机书写者检索方法、装置及存储介质,属于深度学习与模式识别领域。其中方法包括:获取文本无关的笔迹时间序列数据;将获得的笔迹时间序列数据进行归一化处理,并提取多个时间函数,获取标签数据;构建检索模型,根据归一化处理后的时间序列数据和标签数据对检索模型进行训练;将测试笔迹和数据库中所有测试笔迹均输入训练后的检索模型,提取出特征向量;计算测试笔迹的特征向量与数据库中测试笔迹的特征向量之间的余弦相似度,根据余弦相似度获取最终的检索结果。本发明针对联机书写者检索,填补了该领域长期的研究空缺,在不同的文本中提取属于同一个书写者的书写风格,达到远超其他方法的检索性能。
-
公开(公告)号:CN114359939B
公开(公告)日:2024-09-17
申请号:CN202111540686.X
申请日:2021-12-16
Applicant: 华南理工大学
IPC: G06V30/413 , G06V30/414 , G06V30/19 , G06V10/762 , G06V10/74 , G06V10/82 , G06N3/0464 , G06N3/045 , G06N3/044
Abstract: 本发明涉及图像识别领域,具体为基于单元格检测的表格结构识别方法、系统和设备,该方法包括:通过表格区域检测模型从表格图像中定位出表格所在区域,生成新的表格图像;通过改进通用的SBD算法,构建一个基于改进SBD算法的单元格检测模型,单元格检测模型对表格区域内所有单元格进行检测,获取包裹单元格的最小四边形的四个顶点坐标;通过设计一种单元格邻接匹配算法,根据检测的单元格的坐标找到在同一行或者同一列的单元格,通过表格行列聚类结果,预测出表格对应的HTML结构;根据预测出的表格HTML结构,恢复生成和图像中表格结构相同的可编辑形式的表格。本发明可以解决对跨行跨列单元格的结构恢复问题,相对于现有的方法具有更强的普适性。
-
公开(公告)号:CN117975467B
公开(公告)日:2024-08-13
申请号:CN202410390481.5
申请日:2024-04-02
Applicant: 华南理工大学
IPC: G06V30/148 , G06V10/82 , G06V30/19
Abstract: 本发明公开了一种桥接式的端到端文字识别方法,涉及计算机视觉与人工智能技术领域,包括:获取训练好的文本检测模型和文本识别模型,并冻结文本检测模型和文本识别模型的训练参数;获取待处理文本特征图,将待处理文本特征图输入至训练好的文本检测模型中,获得文字区域和文字区域特征;将文字区域和文字区域特征输入桥接转换模型中,获得文字区域融合特征;将文字区域融合特征输入至训练好的文本识别模型,获取识别结果。本发明识别准确率高、鲁棒性强,适用于各种文本检测网络和识别网络。
-
公开(公告)号:CN118135382A
公开(公告)日:2024-06-04
申请号:CN202410088402.5
申请日:2024-01-22
Applicant: 华南理工大学
IPC: G06V20/00 , G06V20/62 , G06V30/18 , G06V30/19 , G06V30/14 , G06V30/146 , G06V10/82 , G06N3/045 , G06N3/0464 , G06N3/084
Abstract: 本发明公开了一种基于特征解耦与纹理比对的图像篡改文本定位方法,包括:构建文本篡改检测模型;利用不同的文本编辑算法产生篡改文本图像数据;通过目标检测模型和纹理特征解耦模块分别提取及解耦输入图像的语义特征图和纹理特征图;利用提取得到的语义特征图进行文本区域定位;利用纹理特征增强模块提取纹理特征图的全局特征;利用篡改特征分类头将纹理特征图中各文本区域特征与全局特征进行对比,根据对比结果判断各文本区域是否为篡改文本区域。本发明将语义特征与纹理特征解耦,避免在篡改检测训练过程中过拟合与篡改特征无关的文本外观语义特征;通过将各文本区域的纹理特征与全局特征进行差异比对,以判断各文本区域是否为篡改文本区域。
-
公开(公告)号:CN118116013A
公开(公告)日:2024-05-31
申请号:CN202311840970.8
申请日:2023-12-28
Applicant: 华南理工大学
IPC: G06V30/302 , G06V30/244 , G06V30/22 , G06V30/18 , G06V30/16 , G06V30/164 , G06V20/80 , G06V40/30
Abstract: 本发明公开了一种基于路径显影的联机手写签名认证方法、装置及介质,属于人工智能及计算机视觉的技术领域。其中方法包括:获取联机签名数据,对联机签名数据进行预处理;对预处理后的联机签名数据进行人工特征提取;根据提取的人工特征,构建并训练基于路径显影的深度特征提取模型;根据训练后的深度特征提取模型,构建联机签名识别认证系统,用于预测输入签名的真伪。本发明采用了路径显影技术(Path Development),该技术采用了李代数将时序路径映射至李群空间,并采用矩阵乘法压缩路径信息,能够更加健壮地表征序列。同时,采用加窗平均方法平衡了模型的全局和局部表征能力,更有利于路径显影层工作。
-
公开(公告)号:CN117542063B
公开(公告)日:2024-04-09
申请号:CN202410033225.0
申请日:2024-01-10
Applicant: 华南理工大学
Abstract: 本发明公开了一种多语言多模态多分支文档视觉信息抽取方法,本发明属于模式识别与人工智能领域,包括:获取若干种语言的文档图像,对所述文档图像进行检测识别,得到文本检测识别结果;对所述文本检测识别结果进行排序,得到已排序检测识别结果;对所述已排序检测识别结果和所述文档图像进行特征提取,得到多模态特征,将所述多模态特征输入多任务预训练模块内不同的预训练任务中进行预训练;基于预训练好的多模态特征,分别进行实体类别预测、实体链接预测,以实现文档视觉信息的抽取。本发明设计的方法在文档视觉信息抽取任务上表现出优异的性能,显著超越同类具有竞争力的其他现有方法。
-
公开(公告)号:CN114120337B
公开(公告)日:2024-04-09
申请号:CN202111203793.3
申请日:2021-10-15
Applicant: 华南理工大学
IPC: G06V30/32 , G06V10/762
Abstract: 本发明公开了一种实时的纸张书写笔迹恢复方法、系统、计算机设备和存储介质,所述方法包括:从书写装置同步采集得到笔尖附近的图像数据、惯性信号数据和笔尖压力传感数据;对图像数据中的图像序列按时间顺序计算相邻两张图像的密集光流,得到光流矢量图序列;根据光流矢量图序列,得到初始笔迹运动矢量序列;根据惯性信号数据计算书写装置的姿态角数据,使用姿态角数据对初始笔迹运动矢量序列进行修正,得到最终笔迹运动矢量序列;根据笔尖压力传感数据,对最终笔迹运动矢量序列的笔画粗细进行调整,得到最终笔迹。通过本发明提供的方法,在普通纸张上书写的同时,能够在电子设备上恢复出书写的内容,且笔迹恢复所用数据的采集成本低。
-
-
-
-
-
-
-
-
-