-
公开(公告)号:CN118469022B
公开(公告)日:2024-10-29
申请号:CN202410919970.5
申请日:2024-07-10
Applicant: 安徽大学
IPC: G06N5/04 , G06N3/0455 , G06N3/0499 , G06F18/25 , G06V10/40 , G06V10/56 , G06V10/58 , G06F40/30 , G06V10/80 , G06V10/82 , G06N3/048
Abstract: 本发明公开了基于文本信息引导的多源遥感视觉问答方法及系统,方法包括:获得RGB特征、SAR特征以及原始文本特征;原始文本特征和RGB特征输入第一特征增强模型得到RGB增强特征,原始文本特征和SAR特征输入第二特征增强模型得到SAR增强特征;RGB增强特征、SAR增强特征以及原始文本特征均输入QGF模型得到图像融合特征;图像融合特征以及原始文本特征输入第一解码器得到融合文本特征的图像特征,将原始文本特征以及图像融合特征输入第二解码器得到融合图像特征的文本特征,经处理得到最终预测的遥感视觉问答任务答案;本发明的优点在于:提高遥感视觉问答任务回答的准确性。
-
公开(公告)号:CN118429622A
公开(公告)日:2024-08-02
申请号:CN202410611543.0
申请日:2024-05-16
Applicant: 安徽大学
IPC: G06V10/25 , G06V20/40 , G06V10/40 , G06V20/70 , G06V10/52 , G06V10/80 , G06V10/82 , G06V10/26 , G06V20/17 , G06N3/0499 , G06N3/048 , G06N3/0464 , G06N3/045
Abstract: 本发明公开了基于河流信息引导的污染物高精度目标检测方法及系统,方法包括:提取含有污染问题的河流视频区段,提取视频帧;将视频帧输入SAM模型的图片编码器得到图像特征嵌入,将文本描述输入Grounding DINO模型,Grounding DINO模型的输出结果输入到SAM模型的提示编码器得到提示特征嵌入;将图像特征嵌入以及提示特征嵌入均输入区域解耦模块得到先验增强特征;将视频帧输入检测器骨干网络获得多尺度特征;将先验增强特征与多尺度特征分别采用FFM模块进行融合得到多尺度融合特征;将多尺度融合特征均输入检测头,对污染物进行识别;本发明的优点在于:减少人力物力,且检测精度高。
-
公开(公告)号:CN118469022A
公开(公告)日:2024-08-09
申请号:CN202410919970.5
申请日:2024-07-10
Applicant: 安徽大学
IPC: G06N5/04 , G06N3/0455 , G06N3/0499 , G06F18/25 , G06V10/40 , G06V10/56 , G06V10/58 , G06F40/30 , G06V10/80 , G06V10/82 , G06N3/048
Abstract: 本发明公开了基于文本信息引导的多源遥感视觉问答方法及系统,方法包括:获得RGB特征、SAR特征以及原始文本特征;原始文本特征和RGB特征输入第一特征增强模型得到RGB增强特征,原始文本特征和SAR特征输入第二特征增强模型得到SAR增强特征;RGB增强特征、SAR增强特征以及原始文本特征均输入QGF模型得到图像融合特征;图像融合特征以及原始文本特征输入第一解码器得到融合文本特征的图像特征,将原始文本特征以及图像融合特征输入第二解码器得到融合图像特征的文本特征,经处理得到最终预测的遥感视觉问答任务答案;本发明的优点在于:提高遥感视觉问答任务回答的准确性。
-
-