-
公开(公告)号:CN119785017A
公开(公告)日:2025-04-08
申请号:CN202411234785.9
申请日:2024-09-04
Applicant: 中南林业科技大学
IPC: G06V10/26 , G06V10/764 , G06V10/52 , G06V10/80 , G06V10/82 , G06N3/0455 , G06N20/20 , G06N3/0499 , G06N3/084
Abstract: 本发明公开了一种基于SAM补全的双解码器集成指示图像分割算法及装置,本发明引入了一种新颖的双分支解码器框架,结合了SAM(Segment Anything Model)用于RIS。该框架结合了一个MLP解码器和一个KAN解码器,并加入了多尺度特征融合模块,增强了模型识别图像中细微细节的能力。通过集成学习策略,框架的鲁棒性得到了进一步加强,整合了MLP和KAN解码器分支的洞见。更重要的是,本发明利用了分割目标边缘坐标和边界框坐标信息作为SAM模型的输入提示。这一策略利用了SAM的零样本学习能力,来完善和优化分割结果。本发明基于广泛认可的RefCOCO、RefCOCO+和RefCOCOg数据集的实验结果证实了这种方法的有效性。结果不仅在分割性能上达到了最先进的水平,而且通过消融研究得到了支持,这些研究突出了每个组件对整体性能改进的贡献。