-
公开(公告)号:CN119723590A
公开(公告)日:2025-03-28
申请号:CN202411911785.8
申请日:2024-12-24
Applicant: 桂林电子科技大学
Abstract: 本发明涉及计算机视觉与人工智能领域,具体涉及一种基于高效融合编码器与文本中心曲线预测的文字识别方法。该方法通过特征提取模块获取图像特征,并利用高效融合编码器捕获高语义信息,同时减少低层次特征的冗余计算。结合特征建模模块,该方法能够准确预测文本实例的边界点和文本中心曲线,并通过并行预测机制同时完成文本实例分类、字符分类、中心曲线点预测和边界点预测。最终,结合解码模块处理字符分类结果,生成文本内容。实验结果表明,该方法在复杂场景中具有较高的识别精度、良好的实时性以及较强的鲁棒性,适用于多种文字检测与识别的应用场景。
-
公开(公告)号:CN119723206A
公开(公告)日:2025-03-28
申请号:CN202411911544.3
申请日:2024-12-24
Applicant: 桂林电子科技大学
IPC: G06V10/764 , G06V20/10 , G06V10/26 , G06V10/774 , G06N20/10 , G06V10/77
Abstract: 本发明涉及高光谱图像分类技术领域,具体涉及一种基于超像素和张量鲁棒主成分分析的高光谱图像分类方法,方法步骤如下:1、选用超像素分割算法对高光谱图像进行超像素分割,获得不规则的超像素分割图;2、从原始高光谱图像获取与超像素分割图对应的不同超像素区域的包络立方体,定义为超张量;3、构建基于超张量的局部邻域保持图;4、设立目标函数,引入辅助变量,并基于交替方向乘子法迭代求解原高光谱图像的低秩项、辅助项和噪声项;5、划分训练集,利用多类支持向量机算法对所得的低秩项进行分类,得到最终的分类结果。本发明通过减轻高光谱图像分类任务中冗余信息和噪声的影响获得更高的地物分类精度。
-