-
公开(公告)号:CN115049989B
公开(公告)日:2025-01-07
申请号:CN202210502081.X
申请日:2022-05-09
Applicant: 南京信息工程大学
Abstract: 本发明提出一种基于多损失联合学习的车辆重识别方法,包括:采用ResNet50网络模型提取得到车辆图像样本中的车辆关键特征;将提取得到的车辆关键特征映射到特征空间中,车辆图像样本在特征空间中的距离用于反映图像之间的相关性;对丢失网络不断训练和学习,使具有相同ID的车辆样本在特征空间中形成聚类;利用BN层对生成的全局特征进行归一化处理;使用批量困难三重损失函数Lt、ID损失函数LID和圆损失函数Lc来对特征向量进行联合学习。本发明能够解决传统的三元组损失的弱约束性,以及具有不同ID但属于同一型号的相似车辆难以区分的技术问题。
-
公开(公告)号:CN118711189B
公开(公告)日:2024-11-08
申请号:CN202411207610.9
申请日:2024-08-30
Applicant: 南京信息工程大学
IPC: G06V30/148 , G06V20/62 , G06V10/82 , G06N3/0464 , G06N3/0442 , G06N3/0455 , G06V10/80
Abstract: 本发明公开了一种基于Transformer的双向场景文本方法,包括以下步骤:(1)开源网站获取数据集,分为训练集和测试集;(2)构建BiSTR双向场景文本识别网络并进行训练,包括:图像编码器模块、ViT字符编码器模块、交叉门控融合机制模块和基于Transformer的双向解码器模块;(3)得到最终预测结果;本发明提出了一个交叉门控融合机制将图像级特征和字符级特征合并提高了模型获取全文信息的能力;在Transformer结构中引入方向嵌入,提供了两个不同方向的解码,上下文信息互为补充,提升了场景文本识别模型的准确性。
-
公开(公告)号:CN113807340B
公开(公告)日:2024-03-15
申请号:CN202111043808.4
申请日:2021-09-07
Applicant: 南京信息工程大学
IPC: G06V20/62 , G06V30/14 , G06V30/19 , G06V10/82 , G06N3/0442 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于注意力机制的不规则自然场景文本识别方法,自然场景文本图像校正模块定位文本区域形状并校正为规则的文本图像;特征提取模块提取不同尺度的视觉特征图;注意力机制对齐模块使用全卷积神经网络将所述不同尺度的视觉特征图对齐得到视觉注意力特征图;上下文特征空间模块将得到的视觉注意力特征图经过上下文选择得到图像的上下文特征图,再将图像的视觉注意力特征图和上下文特征图相连接得到新的特征空间;注意力机制序列识别模块使用LSTM注意力解码器同时对得到的上下文特征空间解码得到识别结果。本发明可以提高不规则场景文本的识别效果,识别精度不会受附近文本和背景噪声的影响,增多了文字识别的应用场景。
-
公开(公告)号:CN113807340A
公开(公告)日:2021-12-17
申请号:CN202111043808.4
申请日:2021-09-07
Applicant: 南京信息工程大学
Abstract: 本发明公开了一种基于注意力机制的不规则自然场景文本识别方法,自然场景文本图像校正模块定位文本区域形状并校正为规则的文本图像;特征提取模块提取不同尺度的视觉特征图;注意力机制对齐模块使用全卷积神经网络将所述不同尺度的视觉特征图对齐得到视觉注意力特征图;上下文特征空间模块将得到的视觉注意力特征图经过上下文选择得到图像的上下文特征图,再将图像的视觉注意力特征图和上下文特征图相连接得到新的特征空间;注意力机制序列识别模块使用LSTM注意力解码器同时对得到的上下文特征空间解码得到识别结果。本发明可以提高不规则场景文本的识别效果,识别精度不会受附近文本和背景噪声的影响,增多了文字识别的应用场景。
-
公开(公告)号:CN114219990B
公开(公告)日:2025-03-11
申请号:CN202111441046.3
申请日:2021-11-30
Applicant: 南京信息工程大学
IPC: G06V20/62 , G06V30/148 , G06V10/44 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/08 , G06N3/0442 , G06N3/045 , G06N3/0475 , G06V30/19
Abstract: 本发明公开了一种基于表征批归一化的自然场景文本识别方法,包括:利用空间转换网络将文本图像规则化为水平文本图像;对现有网络ResNet‑50中引入表征归一化,构建得到特征提取网络;利用所述特征提取网络对水平文本图像进行提取,得到若干个不同分辨率大小的视觉特征图,组成特征金字塔Fr;通过特征增强网络对特征金字塔Fr进行特征提取,并将提取得到的不同尺寸的特征图进行融合,得到相同尺寸大小的特征图;利用视觉‑语义联合网络提取特征图的语义信息,把提取出的语义信息和视觉特征相融合,得到一个新的特征空间;利用解码器对特征空间进行预测,得到最终识别结果。本发明可以提高场景文本识别的准确率,并提升模型的泛化力。
-
公开(公告)号:CN115049989A
公开(公告)日:2022-09-13
申请号:CN202210502081.X
申请日:2022-05-09
Applicant: 南京信息工程大学
Abstract: 本发明提出一种基于多损失联合学习的车辆重识别方法,包括:采用ResNet50网络模型提取得到车辆图像样本中的车辆关键特征;将提取得到的车辆关键特征映射到特征空间中,车辆图像样本在特征空间中的距离用于反映图像之间的相关性;对丢失网络不断训练和学习,使具有相同ID的车辆样本在特征空间中形成聚类;利用BN层对生成的全局特征进行归一化处理;使用批量困难三重损失函数Lt、ID损失函数LID和圆损失函数Lc来对特征向量进行联合学习。本发明能够解决传统的三元组损失的弱约束性,以及具有不同ID但属于同一型号的相似车辆难以区分的技术问题。
-
公开(公告)号:CN114219990A
公开(公告)日:2022-03-22
申请号:CN202111441046.3
申请日:2021-11-30
Applicant: 南京信息工程大学
Abstract: 本发明公开了一种基于表征批归一化的自然场景文本识别方法,包括:利用空间转换网络将文本图像规则化为水平文本图像;对现有网络ResNet‑50中引入表征归一化,构建得到特征提取网络;利用所述特征提取网络对水平文本图像进行提取,得到若干个不同分辨率大小的视觉特征图,组成特征金字塔Fr;通过特征增强网络对特征金字塔Fr进行特征提取,并将提取得到的不同尺寸的特征图进行融合,得到相同尺寸大小的特征图;利用视觉‑语义联合网络提取特征图的语义信息,把提取出的语义信息和视觉特征相融合,得到一个新的特征空间;利用解码器对特征空间进行预测,得到最终识别结果。本发明可以提高场景文本识别的准确率,并提升模型的泛化力。
-
公开(公告)号:CN118711189A
公开(公告)日:2024-09-27
申请号:CN202411207610.9
申请日:2024-08-30
Applicant: 南京信息工程大学
IPC: G06V30/148 , G06V20/62 , G06V10/82 , G06N3/0464 , G06N3/0442 , G06N3/0455 , G06V10/80
Abstract: 本发明公开了一种基于Transformer的双向场景文本方法,包括以下步骤:(1)开源网站获取数据集,分为训练集和测试集;(2)构建BiSTR双向场景文本识别网络并进行训练,包括:图像编码器模块、ViT字符编码器模块、交叉门控融合机制模块和基于Transformer的双向解码器模块;(3)得到最终预测结果;本发明提出了一个交叉门控融合机制将图像级特征和字符级特征合并提高了模型获取全文信息的能力;在Transformer结构中引入方向嵌入,提供了两个不同方向的解码,上下文信息互为补充,提升了场景文本识别模型的准确性。
-
公开(公告)号:CN216751767U
公开(公告)日:2022-06-14
申请号:CN202220228559.X
申请日:2022-01-27
Applicant: 南京信息工程大学
IPC: H04B10/073 , H04B10/071 , G08B7/06
Abstract: 本实用新型公开了一种光缆损伤监测报警设备,包括安装在电线杆上的固定座和安装箱,所述固定座为空心结构且内部设置有用于和电线杆固定连接的连接组件,所述固定座的一侧固定连接有安装块,所述安装块的一侧固定连接有安装箱,所述安装箱的顶部设置有信号发射模组,所述安装箱的底部内壁设置有光时域反射仪和蓄电池,所述安装箱的底部外壁设置有警报器。本实用新型结构简单,通过光缆与接口相连接能够让光时域反射仪为该线路段进行检测,橡胶圈可以让光缆与线孔贴合的更紧密,密封垫能够防止雨水进入安装箱,转动把手可以将设备安装在电线杆上或者卸除,安装箱顶部设置的太阳能板不仅能为蓄电池蓄电,还能为安装箱遮雨。
-
-
-
-
-
-
-
-