-
公开(公告)号:CN119445321A
公开(公告)日:2025-02-14
申请号:CN202411332477.X
申请日:2024-09-24
Applicant: 南京信息工程大学
IPC: G06V10/82 , G06V10/42 , G06V10/44 , G06V10/80 , G06V10/764 , G06N3/0464 , G06N3/042
Abstract: 本发明公开了车辆再识别技术领域的一种车辆识别方法,旨在解决识别车辆的精度低、无法区分视觉上相似的车辆的技术问题。其包括:通过利用图结构获得局部的细粒度特征,通过局部的细粒度特征和全局特征融合获得的融合特征识别车辆,提高了系统的识别能力和鲁棒性,改善了系统在现实世界中应对环境不一致性的功效,确保了可靠的车辆识别,提高了准确性和重点区域识别能力,实现区分视觉上相似的车辆。
-
公开(公告)号:CN118711189A
公开(公告)日:2024-09-27
申请号:CN202411207610.9
申请日:2024-08-30
Applicant: 南京信息工程大学
IPC: G06V30/148 , G06V20/62 , G06V10/82 , G06N3/0464 , G06N3/0442 , G06N3/0455 , G06V10/80
Abstract: 本发明公开了一种基于Transformer的双向场景文本方法,包括以下步骤:(1)开源网站获取数据集,分为训练集和测试集;(2)构建BiSTR双向场景文本识别网络并进行训练,包括:图像编码器模块、ViT字符编码器模块、交叉门控融合机制模块和基于Transformer的双向解码器模块;(3)得到最终预测结果;本发明提出了一个交叉门控融合机制将图像级特征和字符级特征合并提高了模型获取全文信息的能力;在Transformer结构中引入方向嵌入,提供了两个不同方向的解码,上下文信息互为补充,提升了场景文本识别模型的准确性。
-
公开(公告)号:CN118711189B
公开(公告)日:2024-11-08
申请号:CN202411207610.9
申请日:2024-08-30
Applicant: 南京信息工程大学
IPC: G06V30/148 , G06V20/62 , G06V10/82 , G06N3/0464 , G06N3/0442 , G06N3/0455 , G06V10/80
Abstract: 本发明公开了一种基于Transformer的双向场景文本方法,包括以下步骤:(1)开源网站获取数据集,分为训练集和测试集;(2)构建BiSTR双向场景文本识别网络并进行训练,包括:图像编码器模块、ViT字符编码器模块、交叉门控融合机制模块和基于Transformer的双向解码器模块;(3)得到最终预测结果;本发明提出了一个交叉门控融合机制将图像级特征和字符级特征合并提高了模型获取全文信息的能力;在Transformer结构中引入方向嵌入,提供了两个不同方向的解码,上下文信息互为补充,提升了场景文本识别模型的准确性。
-
-