-
公开(公告)号:CN119477700A
公开(公告)日:2025-02-18
申请号:CN202411492639.6
申请日:2024-10-24
Applicant: 安徽大学
IPC: G06T3/4061 , G06T3/4046 , G06V10/44 , G06V10/77 , G06V10/80 , G06V10/82 , G06N3/0455 , G06N3/0442 , G06N3/0464
Abstract: 本发明提供一种引导解耦的无人机热红外图像超分辨率模型、方法及训练方法,属于计算机视觉和图像处理技术领域。模型集成了特定属性引导模块,对于低光照,有雾,和正常光照条件下的图像设计不同分支进行特征处理。确保在不同场景下对可见光图像实现有效特征提取。感知属性融合模块实现对三个分支的特征进行自适应聚合。多场景可见光引导模块使用多种注意力机制将实现可见光图像和热红外图像的特征交互,实现可见光图像对热红外图像的高效引导。与现有最先进的单图像超分辨率方法和引导型超分辨率方法相比,本发明恢复了更丰富的纹理和结构细节,并在评估指标和视觉感知方面有更好的表现。
-
公开(公告)号:CN117726949A
公开(公告)日:2024-03-19
申请号:CN202311188848.7
申请日:2023-09-14
Applicant: 安徽大学
Abstract: 本发明提供基于场景信息解耦引导的极小物体检测方法及系统,方法包括获取大规模高空遥感卫星图像解耦的场景上下文信息;将解耦后的特征图送入前景增强模块中,以产生增强前景特征图;将获取的前景特征图与主干网络提取的特征图送入场景信息融合模块;通过对融合的特征图进行上采样,得到对极小目标的检测。本发明解决了在大规模高空遥感卫星图中对于密集极小目标的场景下,存在的误检率高、目标分类错误和运动轨迹偏差的技术问题。
-
公开(公告)号:CN118941914A
公开(公告)日:2024-11-12
申请号:CN202410861508.4
申请日:2024-06-28
Applicant: 安徽大学
IPC: G06V10/82 , G06V10/20 , G06V10/40 , G06V10/766 , G06V10/25 , G06V10/764 , G06N3/0464 , G06N3/084 , G06N3/09
Abstract: 本发明提供结构信息引导的SAR目标细粒度识别方法及系统,方法包括:采用了YOLOv5的策略进行数据预处理;将预处理后的数据送入DCN和注意力模块中,对图像中的关键特征进行引导增强;特征送入检测头,生成最终的识别结果;采用Focaler‑SloU进行网络训练。本发明解决了鲁棒性和泛化性较弱、虚警率高、漏检错检以及目标具体型号难以进行准确的细粒度分类的技术问题。
-
公开(公告)号:CN118469022A
公开(公告)日:2024-08-09
申请号:CN202410919970.5
申请日:2024-07-10
Applicant: 安徽大学
IPC: G06N5/04 , G06N3/0455 , G06N3/0499 , G06F18/25 , G06V10/40 , G06V10/56 , G06V10/58 , G06F40/30 , G06V10/80 , G06V10/82 , G06N3/048
Abstract: 本发明公开了基于文本信息引导的多源遥感视觉问答方法及系统,方法包括:获得RGB特征、SAR特征以及原始文本特征;原始文本特征和RGB特征输入第一特征增强模型得到RGB增强特征,原始文本特征和SAR特征输入第二特征增强模型得到SAR增强特征;RGB增强特征、SAR增强特征以及原始文本特征均输入QGF模型得到图像融合特征;图像融合特征以及原始文本特征输入第一解码器得到融合文本特征的图像特征,将原始文本特征以及图像融合特征输入第二解码器得到融合图像特征的文本特征,经处理得到最终预测的遥感视觉问答任务答案;本发明的优点在于:提高遥感视觉问答任务回答的准确性。
-
公开(公告)号:CN118429622A
公开(公告)日:2024-08-02
申请号:CN202410611543.0
申请日:2024-05-16
Applicant: 安徽大学
IPC: G06V10/25 , G06V20/40 , G06V10/40 , G06V20/70 , G06V10/52 , G06V10/80 , G06V10/82 , G06V10/26 , G06V20/17 , G06N3/0499 , G06N3/048 , G06N3/0464 , G06N3/045
Abstract: 本发明公开了基于河流信息引导的污染物高精度目标检测方法及系统,方法包括:提取含有污染问题的河流视频区段,提取视频帧;将视频帧输入SAM模型的图片编码器得到图像特征嵌入,将文本描述输入Grounding DINO模型,Grounding DINO模型的输出结果输入到SAM模型的提示编码器得到提示特征嵌入;将图像特征嵌入以及提示特征嵌入均输入区域解耦模块得到先验增强特征;将视频帧输入检测器骨干网络获得多尺度特征;将先验增强特征与多尺度特征分别采用FFM模块进行融合得到多尺度融合特征;将多尺度融合特征均输入检测头,对污染物进行识别;本发明的优点在于:减少人力物力,且检测精度高。
-
公开(公告)号:CN118469022B
公开(公告)日:2024-10-29
申请号:CN202410919970.5
申请日:2024-07-10
Applicant: 安徽大学
IPC: G06N5/04 , G06N3/0455 , G06N3/0499 , G06F18/25 , G06V10/40 , G06V10/56 , G06V10/58 , G06F40/30 , G06V10/80 , G06V10/82 , G06N3/048
Abstract: 本发明公开了基于文本信息引导的多源遥感视觉问答方法及系统,方法包括:获得RGB特征、SAR特征以及原始文本特征;原始文本特征和RGB特征输入第一特征增强模型得到RGB增强特征,原始文本特征和SAR特征输入第二特征增强模型得到SAR增强特征;RGB增强特征、SAR增强特征以及原始文本特征均输入QGF模型得到图像融合特征;图像融合特征以及原始文本特征输入第一解码器得到融合文本特征的图像特征,将原始文本特征以及图像融合特征输入第二解码器得到融合图像特征的文本特征,经处理得到最终预测的遥感视觉问答任务答案;本发明的优点在于:提高遥感视觉问答任务回答的准确性。
-
公开(公告)号:CN117496459A
公开(公告)日:2024-02-02
申请号:CN202311512570.4
申请日:2023-11-10
Applicant: 安徽大学
Abstract: 本发明提供基于CRNet的无人机视频车辆检测方法及系统,方法包括:采集得到差异场景视频数据,据以构建无人机视频时序序列;对差异场景视频数据,进行类别标注操作,以得到车辆类别标注数据;基于CRNet,将无人机视频时序序列作为模型输入数据,设置模型骨干网络时序增强模块,据以构建车辆检测识别模型;根据车辆检测识别模型,求取box损失、角度损失,以求取回归损失及分类损失,据以处理得到整体损失。本发明解决了难以排除运动模糊、随机遮挡以及密集分布的不利影响,以及对细粒度目标分类能力差的技术问题。
-
公开(公告)号:CN117173023A
公开(公告)日:2023-12-05
申请号:CN202311205827.1
申请日:2023-09-18
Applicant: 安徽大学
IPC: G06T3/40 , G06T5/50 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 本发明提供无人机高分辨率热红外图像生成方法及系统,方法包括:对无人机捕获的热图像和可见光图像进行不同类型的浅层特征提取,得到两种模态的浅层特征;构建并利用相互指导模块MGM,将可见和热成像特征分别输入到MGM的两个不同分支中,以提取两个子任务的深层特征,通过双向注意力传递机制,使两个任务之间进行全面的特征交互,得到高质量的模态转换和超分辨率特征;构建并利用双向对齐融合模块BAFM,同时将两个分支的输出精细对齐到相同的特征空间,并进行特征融合;融合的特征通过pixelshuffle上采样得到超分辨率结果。本发明解决了由于可见图像和热红外图像信息利用不充分、不同模态之间存在差异导致无人机热红外图像质量较低的技术问题。
-
公开(公告)号:CN116523753A
公开(公告)日:2023-08-01
申请号:CN202310511388.0
申请日:2023-05-06
Applicant: 安徽大学
Abstract: 本发明提供多线索引导的无人机热红外图像超分辨率重建方法及系统,方法包括:提取可见光图像及热红外图像中的线索特征;将已得到的线索送入多线索引导模块中,以产生不同的特征;三种线索送入渐进式融合模块进行融合;通过对融合的特征图进行上采样,得到高分辨率无人机热红外图像。本发明解决了大规模图像超分辨率重建的场景下纹理信息恢复困难、图像纹理恢复错误、纹理恢复真实性低、恢复细节较少的技术问题。
-
公开(公告)号:CN119850422A
公开(公告)日:2025-04-18
申请号:CN202510030759.2
申请日:2025-01-08
Applicant: 安徽大学
IPC: G06T3/4053 , G06T3/4046 , G06V10/40 , G06V10/771 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/045
Abstract: 本发明提供一种基于Mamba的光学引导的合成孔径雷达图像超分辨率重建方法及系统,包括:浅层特征提取的步骤:采用卷积法将SAR图像和光学图像编码成统一的特征空间;多模态特征融合的步骤:将提取的浅层特征作为CFSM模块和FSAM模块的输入,动态选择相关和显著的光学特征,并根据状态空间参数在空间域和频域自适应地进行多模态特征融合,从而生成高质量的融合特征;高分辨率图像重建的步骤:将浅层特征和融合特征聚合,然后对聚合后的特征进行上采样,从而重建高分辨率图像。本发明利用视觉状态空间方程长距离建模的优势,渐进式选择光学信息中有用的信息并自适应地跨模态特征集成,有效利用空间域和频域特征,减少噪声干扰的同时恢复了更真实的纹理细节信息,实现了优越的性能。
-
-
-
-
-
-
-
-
-