-
公开(公告)号:CN119961478A
公开(公告)日:2025-05-09
申请号:CN202411894851.5
申请日:2024-12-21
Applicant: 桂林理工大学
IPC: G06F16/583 , G06V10/20 , G06V10/40 , G06V10/774 , G06V10/776 , G06F18/22 , G06N3/0499 , G06N3/08
Abstract: 本发明公开了一种基于增强数据集和多层次注意力(Multi‑Level Layer Attention,MLLA)模块的遥感图像图文检索方法。该方法包括以下步骤:首先,进行数据预处理,通过归一化处理原始遥感图像数据,并采用多种变换技术构建增强数据集;其次,在现有的RemoteCLIP模型基础上,集成多层次线性注意力模块,构建EnhanceMLLA‑RemoteCLIP模型;然后,使用增强数据集对该模型进行微调训练,以提升其对图像细节和局部特征的捕捉能力;最后,将训练好的EnhanceMLLA‑RemoteCLIP模型应用于待检索的遥感图像,实现精准有效的图文检索。通过引入增强数据集和多层次注意力机制,本发明显著增强了模型对图像变形、损坏、失真和噪声的鲁棒性,提升了遥感图像的检索能力,使得对各种复杂遥感图像数据的检索更加高效和准确。