-
公开(公告)号:CN114627492B
公开(公告)日:2024-08-13
申请号:CN202210118669.5
申请日:2022-02-08
Applicant: 湖北工业大学
Abstract: 本发明公开了一种双金字塔结构引导的多粒度行人重识别方法及系统,首先在ResNet50中嵌入注意力金字塔,引导网络由粗到细依次挖掘不同粒度的特征,使网络更倾向于关注复杂环境中行人的显著区域;其次通过结构不对称的双重注意力特征金字塔分支,以提取多尺度的行人特征,丰富特征的多样性,同时双重注意力机制可使分支从浅层信息中捕获高细粒度的局部特征;最后将粒度较粗的全局特征与多层级细粒度的局部特征融合,两种金字塔相互作用,以此获得更多具有鉴别性的多粒度特征,以改善行人遮挡问题。本发明仅通过较少的计算量,便可有效地解决杂乱场景下难以提取行人关键信息和局部遮挡时全局特征方法失效而造成识别精度不高的问题。
-
公开(公告)号:CN115601542B
公开(公告)日:2023-07-21
申请号:CN202211229781.2
申请日:2022-10-08
Applicant: 湖北工业大学
IPC: G06V10/26 , G06N3/0464 , G06N3/08 , G06V10/82
Abstract: 本发明公开了一种基于全尺度密集连接的图像语义分割方法、系统及设备,首先对待分割图像进行预处理,将其切割或填充为预设大小;然后使用图像语义分割网络实现对待分割图像的语义分割;本发明的图像语义分割网络(UNet4+)通过全尺度和密集的跳跃连接,编码器中的每个节点从不同尺度的编码器接收中间聚合特征图,而解码器中的每个节点不仅从不同尺度的编码器和解码器接收中间聚合特征图,而且还从相同尺度的编码器接收中间聚合特征图。因此,解码器中的聚合层可以学习使用节点上的所有收集的特征图。本发明的UNet4+缓解了梯度消失的问题,这也使得网络中的信息流最大化;同时加强了网络中的特征传播;具备更紧凑的模型和极端的特征重用性。
-
公开(公告)号:CN114638836B
公开(公告)日:2024-04-30
申请号:CN202210148745.7
申请日:2022-02-18
Applicant: 湖北工业大学
Abstract: 本发明公开了一种基于高度有效驱动与多层级特征融合的城市街景分割方法,结合城市街景图像的位置先验性,在改进的网络中加入HEAM,从而加强网络在不同高度位置上对相应目标的特征提取能力。将HEAM嵌入特征提取网络与ASPP结构中,使网络在做深层卷积和通过ASPP做多层空洞卷积时,提升对深层特征和多尺度特征的提取能力。HEAM提取代表相应目标水平部分的高度上下文信息,从高度上下文信息中预测目标水平部分的特征或类别。网络中的浅层特征分辨率高、包含更多位置和细节信息,而深层特征分辨率低、对细节感知差,但拥有更强的语义信息。所以,经常通过融合浅层特征和深层特征,使特征具有更完整的信息表达来提高分割精度。
-
公开(公告)号:CN116245927B
公开(公告)日:2024-01-16
申请号:CN202310116947.8
申请日:2023-02-09
Applicant: 湖北工业大学
IPC: G06T7/55 , G06T7/73 , G06N3/0464
Abstract: 失,它更加准确的监督Depth网络的训练。本发明本发明公开了一种基于ConvDepth的自监督 不仅将ConvNeXt骨干引入到自监督深度估计任单目深度估计方法及系统,本发明基于无结构单 务中,打破了现有技术中ResNet的“垄断”,而且目视频的自监督单目深度估计,目标图像It经过 设计了多层级细节增强模块和视差头,极大程度depth网络生成视差图Dt(或深度图 其中 的激发了ConvNeXt骨干的潜力。为Dt的倒数);连续两帧图像(Is,It)的堆叠采用Pose网络预测6D旋转和平移矩阵Tt→s;然后将目标图像反向warping,生成重建图像 本发明基于运动结构恢复算法,极大程度的减少了训练(56)对比文件Varun Ravi Kumar 等.UnRectDepthNet:Self-Supervised Monocular DepthEstimation using a Generic Framework forHandling Common Camera Distortion Models.《2020 IEEE/RSJ International Conferenceon Intelligent Robots and Systems(IROS)》.2020,全文.Madhu Babu V 等.UnDEMoN: UnsupervisedDeep Network for Depth and Ego-MotionEstimation《.018 IEEE/RSJ InternationalConference on Intelligent Robots andSystems (IROS)》.2018,全文.熊炜 等.基于深度学习特征点法的单目视觉里程计《.计算机工程与科学》.2020,全文.
-
公开(公告)号:CN114638836A
公开(公告)日:2022-06-17
申请号:CN202210148745.7
申请日:2022-02-18
Applicant: 湖北工业大学
Abstract: 本发明公开了一种基于高度有效驱动与多层级特征融合的城市街景分割方法,结合城市街景图像的位置先验性,在改进的网络中加入HEAM,从而加强网络在不同高度位置上对相应目标的特征提取能力。将HEAM嵌入特征提取网络与ASPP结构中,使网络在做深层卷积和通过ASPP做多层空洞卷积时,提升对深层特征和多尺度特征的提取能力。HEAM提取代表相应目标水平部分的高度上下文信息,从高度上下文信息中预测目标水平部分的特征或类别。网络中的浅层特征分辨率高、包含更多位置和细节信息,而深层特征分辨率低、对细节感知差,但拥有更强的语义信息。所以,经常通过融合浅层特征和深层特征,使特征具有更完整的信息表达来提高分割精度。
-
公开(公告)号:CN116434241A
公开(公告)日:2023-07-14
申请号:CN202310120821.8
申请日:2023-02-13
Applicant: 湖北工业大学
IPC: G06V30/18 , G06V30/146 , G06V30/19 , G06N3/045
Abstract: 本发明公开了一种基于注意力机制的自然场景图像中文本识别方法及系统,一种无需校正或分割的方法,通过搭建多级Efficient Swin Transformer网络提取丰富的全局特征,实现不同窗口特征之间的信息交互,对全局信息进行建模,并且嵌入通道注意力突出某些重要通道的特征。后经注意力机制得到视觉特征,使得网络将关注的焦点置于特征图的文本区域,提高了网络的特征提取能力;其次通过语义推理模块考虑字符上下文信息,对文本序列进行建模得到语义特征,提升了网络的预测能力;最后使用双特征融合单元融合不同模态的视觉、语义特征,并分类得到最终的文本识别结果,有效地避免了分割字符的缺陷,同时考虑到了字符与字符之间的内在联系。
-
公开(公告)号:CN116245927A
公开(公告)日:2023-06-09
申请号:CN202310116947.8
申请日:2023-02-09
Applicant: 湖北工业大学
IPC: G06T7/55 , G06T7/73 , G06N3/0464
Abstract: 本发明公开了一种基于ConvDepth的自监督单目深度估计方法及系统,本发明基于无结构单目视频的自监督单目深度估计,目标图像It经过depth网络生成视差图Dt(或深度图其中为Dt的倒数);连续两帧图像(Is,It)的堆叠采用Pose网络预测6D旋转和平移矩阵Tt→s;然后将目标图像反向warping,生成重建图像本发明基于运动结构恢复算法,极大程度的减少了训练网络的成本,具有极大的扩展性。本发明所提出的Depth网络结构,能够生成更加准确、细节更加丰富的深度图。本发明提出了鲁棒性自蒸馏损失,它更加准确的监督Depth网络的训练。本发明不仅将ConvNeXt骨干引入到自监督深度估计任务中,打破了现有技术中ResNet的“垄断”,而且设计了多层级细节增强模块和视差头,极大程度的激发了ConvNeXt骨干的潜力。
-
公开(公告)号:CN115601542A
公开(公告)日:2023-01-13
申请号:CN202211229781.2
申请日:2022-10-08
Applicant: 湖北工业大学(CN)
Abstract: 本发明公开了一种基于全尺度密集连接的图像语义分割方法、系统及设备,首先对待分割图像进行预处理,将其切割或填充为预设大小;然后使用图像语义分割网络实现对待分割图像的语义分割;本发明的图像语义分割网络(UNet4+)通过全尺度和密集的跳跃连接,编码器中的每个节点从不同尺度的编码器接收中间聚合特征图,而解码器中的每个节点不仅从不同尺度的编码器和解码器接收中间聚合特征图,而且还从相同尺度的编码器接收中间聚合特征图。因此,解码器中的聚合层可以学习使用节点上的所有收集的特征图。本发明的UNet4+缓解了梯度消失的问题,这也使得网络中的信息流最大化;同时加强了网络中的特征传播;具备更紧凑的模型和极端的特征重用性。
-
公开(公告)号:CN115578339A
公开(公告)日:2023-01-06
申请号:CN202211208711.9
申请日:2022-09-30
Applicant: 湖北工业大学
IPC: G06T7/00 , G06V10/26 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种工业产品表面缺陷检测与定位方法、系统及设备,首先预处理待检测产品的原始外观图像为预设大小;然后使用语义分割网络实现对产品表面缺陷进行像素级定位;最后将原始外观图像以及语义分割网络的输出作为分类决策网络的输入,进行产品表面缺陷检测与定位;本发明通过利用一种基于两阶段架构的深度卷积网络的有效方法来解决数据样本需求问题,新的语义分割网络和分类决策网络的提出,适合从少量缺陷样本中学习,但仍然可以得到最优性能。
-
公开(公告)号:CN114627492A
公开(公告)日:2022-06-14
申请号:CN202210118669.5
申请日:2022-02-08
Applicant: 湖北工业大学
Abstract: 本发明公开了一种双金字塔结构引导的多粒度行人重识别方法及系统,首先在ResNet50中嵌入注意力金字塔,引导网络由粗到细依次挖掘不同粒度的特征,使网络更倾向于关注复杂环境中行人的显著区域;其次通过结构不对称的双重注意力特征金字塔分支,以提取多尺度的行人特征,丰富特征的多样性,同时双重注意力机制可使分支从浅层信息中捕获高细粒度的局部特征;最后将粒度较粗的全局特征与多层级细粒度的局部特征融合,两种金字塔相互作用,以此获得更多具有鉴别性的多粒度特征,以改善行人遮挡问题。本发明仅通过较少的计算量,便可有效地解决杂乱场景下难以提取行人关键信息和局部遮挡时全局特征方法失效而造成识别精度不高的问题。
-
-
-
-
-
-
-
-
-