一种基于增强数据集和多层次注意力模块的遥感图像图文检索方法

    公开(公告)号:CN119961478A

    公开(公告)日:2025-05-09

    申请号:CN202411894851.5

    申请日:2024-12-21

    Inventor: 周国清 李天皓

    Abstract: 本发明公开了一种基于增强数据集和多层次注意力(Multi‑Level Layer Attention,MLLA)模块的遥感图像图文检索方法。该方法包括以下步骤:首先,进行数据预处理,通过归一化处理原始遥感图像数据,并采用多种变换技术构建增强数据集;其次,在现有的RemoteCLIP模型基础上,集成多层次线性注意力模块,构建EnhanceMLLA‑RemoteCLIP模型;然后,使用增强数据集对该模型进行微调训练,以提升其对图像细节和局部特征的捕捉能力;最后,将训练好的EnhanceMLLA‑RemoteCLIP模型应用于待检索的遥感图像,实现精准有效的图文检索。通过引入增强数据集和多层次注意力机制,本发明显著增强了模型对图像变形、损坏、失真和噪声的鲁棒性,提升了遥感图像的检索能力,使得对各种复杂遥感图像数据的检索更加高效和准确。

Patent Agency Ranking