-
公开(公告)号:CN114863208A
公开(公告)日:2022-08-05
申请号:CN202210413768.6
申请日:2022-04-19
Applicant: 安徽理工大学
IPC: G06V10/774 , G06V10/82 , G06V10/80 , G06V10/77 , G06V10/46 , G06V10/44 , G06V10/42 , G06N3/04 , G06K9/62
Abstract: 本发明属于计算机视觉领域,提供了一种基于渐进收缩和循环交互网络的显著性目标检测算法,包括以下步骤:1)利用预训练好的ResNet‑50网络作为主干网络提取初始多层次特征;2)利用多尺度上下文注意力模块捕获局部和全局上下文注意力信息,然后通过聚合这些信息增加初始多层次特征中的显著性目标信息;3)利用相邻特征收缩与交互模块将优化后的多层次特征逐渐压缩和交互生成高质量特征表示;4)利用降维操作和Sigmoid函数将生成的高质量表示进行降维激活预测初始显著性图,并利用混合损失函数训练此模型。大量的在多个公开的数据集上的实验数据表明了,此发明具有高效性和优越性。
-
公开(公告)号:CN114529740A
公开(公告)日:2022-05-24
申请号:CN202210029292.6
申请日:2022-01-07
Applicant: 安徽理工大学
Abstract: 本发明属于计算机视觉领域,提供了基于边缘指导和多层次特征动态聚合的显著性目标检测方法,包括以下步骤:1)利用VGG‑16主干框架对RGB图像进行初始多层次特征提取并进行编码;2)利用多层次特征动态聚合模块强化多层次特征,生成初始显著性图;3)利用边缘预测模块从主干网络中低层次的特征生成高质量边缘信息图;4)初始显著性图与边缘信息图进行高效融合增强显著性目标的边缘信息,生成高性能最终显著性图。与现有的技术相比,本发明基于边缘指导和多层次特征动态聚合的显著性目标检测方法通过集成两个模块极大提升优化多层次特征的表达能力,进一步提升显著性图的质量。
-
公开(公告)号:CN116486112A
公开(公告)日:2023-07-25
申请号:CN202310410912.5
申请日:2023-04-18
Applicant: 安徽理工大学
IPC: G06V10/70 , G06V10/82 , G06V10/80 , G06N3/08 , G06N3/0455
Abstract: 本发明属于计算机视觉领域,提供了一种基于轻量化跨模态融合网络的RGB‑D显著性目标检测方法,包括以下步骤:1)获取训练和测试该任务的RGB‑D数据集,并定义本发明的算法目标2)构建用于提取RGB图像特征的编码器和深度图像特征的编码器;3)建立跨模态特点融合网络,通过渐进式引导的注意力机制增强RGB图像和深度图像特征特征的表达;4)基于上述的跨模态特征融合成的多模态特征,构建一个轻量化的全局上下文整合模块,以提取融合模态多尺度上下文特征;5)构建了一个简单高效的多路径聚合模块来整合融合特征,原始的RGB和深度图特征,并通过激活函数得到最终的预测到的显著图。
-
公开(公告)号:CN114758279A
公开(公告)日:2022-07-15
申请号:CN202210443675.8
申请日:2022-04-24
Applicant: 安徽理工大学
IPC: G06V20/40
Abstract: 本发明属于计算机视觉领域,提供了一种基于时间域信息传递的视频目标检测方法,包括以下步骤:1)获取并输入视频数据;2)对视频帧进行分成每m一组;3)通过信息传递模块,首先对每一组连续帧进行合并,获取特征并通过门控循环单元实现上下文信息的传递;4)利用YOLOV5对数据进行后续检测,使用Focal Loss交叉熵损失与DIoU Loss函数训练此模型。与现有的技术相比,本发明基于YOLOV5模型对其进行了改进使其更注重连续帧中相邻帧的信息,可以有效提升目标检测的质量。
-
公开(公告)号:CN118314426A
公开(公告)日:2024-07-09
申请号:CN202410317295.9
申请日:2024-03-20
Applicant: 安徽理工大学
IPC: G06V10/80 , G06V10/764 , G06V10/774 , G06V10/82 , G06V20/64 , G06N3/0464
Abstract: 本发明属于计算机视觉领域,具体涉及一种基于伪点云增强和多阶段特征融合的多模态3D目标检测算法。该算法包括伪点云增强和多级特征融合模块、多阶段可变形交叉注意力对齐模块、重采样和多级特征融合模块。具体来说,基于伪点云增强和多阶段特征融合的多模态3D目标检测算法采用深度补全与映射矩阵,将图像数据映射成伪点云,用伪点云特征来对原始点云数据进行数据增强;体素化网络用于对原始点云数据进行预处理,稀疏卷积用来计算点云的特征,可变形交叉注意力(Deformable Cross Attention)机制用于对齐多个阶段的特征;使用重采样和多级特征融合策略,丰富特征信息以实现高效检测,有效的提升了检测的精度和模型的鲁棒性。
-
公开(公告)号:CN117523221A
公开(公告)日:2024-02-06
申请号:CN202311348228.5
申请日:2023-10-17
Applicant: 安徽理工大学
IPC: G06V10/44 , G06V10/774 , G06V10/82 , G06N3/0464 , G06V10/86
Abstract: 本发明涉及一种边缘引导增强的伪装目标检测,由于目前的伪装物体变的十分的复杂,背景与前景高度相似,伴随着弱边界,低对比度,边界损坏或者身体轮廓伪装,现有方法不能完全识别物体的结构和细节,因此现有算法检测伪装目标的能力有待提高。因此提出了边缘引导增强的伪装目标检测。包括主干网络用来提取特征,边缘增强块(EEB),边缘指导模块(EGM)以及跨级别融合模块(CLFM)。将主干网络提取的特征分别输入到边缘增强模块和边缘指导模块,边缘增强模块获得的边缘预测图输入到边缘指导模块,由边缘指导模块输出的特征输入到跨级别融合模块进行多尺度的特征融合。实验结果表明具有更高的边缘检测性能。
-
公开(公告)号:CN117475134A
公开(公告)日:2024-01-30
申请号:CN202311379391.8
申请日:2023-10-24
Applicant: 安徽理工大学
Abstract: 本发明属于计算机视觉领域,提供了基于多尺度跨层特征融合网络的伪装目标检测算法,包括以下步骤:1)利用BM(Boundary‑guidance Module)模块定位伪装对象的边界,由于伪装的物体在视觉上嵌入到它们的背景中,这使得伪装的物体和周围背景之间的边界不清晰,因此BM模块起到了很大的作用。2)利用MSAM(Multi‑scale Feature Aggregation Module)模块从单个卷积层捕获多尺度特征,MSAM利用不同大小的卷积核来自适应地提取不同尺度的特征。3)利用MIAB(Multi‑source Information Aggregation Block)多元信息融合模块来进一步增强高分辨率特征图中的结构信息。4)利用混合损失函数训练此模型,使用GT(Ground Truth)来监督每一层生成的预测图,并且逐步细化目标区域,用图中的P1作为最终的结果。
-
公开(公告)号:CN116485860A
公开(公告)日:2023-07-25
申请号:CN202310429798.0
申请日:2023-04-18
Applicant: 安徽理工大学
IPC: G06T7/50 , G06N3/0455 , G06N3/0464
Abstract: 本发明属于计算机视觉图像处理领域,提出了一种基于多尺度渐进交互和聚合交叉注意力特征的单目深度预测算法,包括以下步骤:在编码器中首先使用预训练后的ResNet‑50网络从输入的RGB图像中逐渐提取多尺度的特征,之后添加Transformer模块帮助解决卷积神经网络有限的感受野问题,指导提取编码器最终的深度特征图;其次,在解码器中,通过提出的查询注意模块渐进式地交互查询和利用来自多尺度ResNet‑50卷积模块提取的不同区域特征以及Transformer模块提取的全局上下文信息特征,做到充分增强和融合空间信息的多样性和相关性,逐渐查询细化边缘特征。本文提出的查询交叉注意模块(QAM)既能够充分地利用卷积神经网络对空间相关性建模的归纳偏差又能够使用Transformer对全局关系建模从而获得更细粒度和密集的深度特征表示,生成高质量的深度预测图。
-
公开(公告)号:CN114913344A
公开(公告)日:2022-08-16
申请号:CN202210019564.4
申请日:2022-01-07
Applicant: 安徽理工大学
Abstract: 本发明属于计算机视觉领域,提供了一种层次化多感受野网络的显著性目标检测算法,包括以下步骤:1)将ResNet‑50作为主干框架对RGB图像提取多尺度特征信息然后进行编码;2)利用层次化多感受野卷积机制优化多层次特征生成高质量特征;3)利用隐形关系特征融合机制将优化后的特征进行互补性融合,然后生成最终显著性图。与现有的技术相比,本发明层次化多感受野网络的显著性目标检测算法利用不同层次感受野的卷积操作优化多层次特征并进行隐形关系特征融合,多层次特征逐层优化生成高性能显著性图。
-
公开(公告)号:CN114898356A
公开(公告)日:2022-08-12
申请号:CN202210536412.1
申请日:2022-05-12
Applicant: 安徽理工大学
Abstract: 本发明属于计算机视觉领域,提供了基于球体空间特征和多模态交叉融合网络的3D目标检测算法,包括以下步骤:1)利用体素质心下采样算法从原始点云数据中心选取关键点,然后以关键点为中心搜索邻近固定半径内的点;2)利用稀疏卷积对选取的每个球体中的点进行特征提取,得到空间组,再运用卷积操作得到空间特征;3)利用三层UNet网络对RGB图像进行多尺度特征提取,得到语义组,通过MLP将其扩展到与空间特征相同的维度,得到语义特征;4)使用交叉注意力机制融合空间特征与语义特征,融合后的特征再输入到检测头进行检测,并利用混合损失函数训练此模型。大量的在多个公开的数据集上的实验数据表明了,此发明具有高效性和优越性。
-
-
-
-
-
-
-
-
-