开放场景多模态图像-文本零样本语义分割方法及系统

    公开(公告)号:CN119399458A

    公开(公告)日:2025-02-07

    申请号:CN202411352873.9

    申请日:2024-09-26

    Abstract: 本发明公开了开放场景多模态图像‑文本零样本语义分割方法及系统,属于图像语义分割技术领域,适应于处理热感以及红外图像,提升RGB‑T语义分割在多个场景的零样本泛化性能。包括两个阶段:RGB‑T开放词汇目标检测阶段和语义分割阶段。RGB‑T开放词汇目标检测阶段以像素级配对的RGB图像和热感图像以及文本作为多模态输入,利用文本信息和视觉提示作为条件,为融合图像的目标区域生成初始检测提议,对初始检测提议进行语义一致矫正修正有歧义的类别,得到矫正后的预测类别。语义分割阶段将矫正后的检测类别作为分割基础模型的提示,对融合图像进行语义分割并生成对目标的文字说明。

    基于联合条件扩散模型的混合退化图像复原方法

    公开(公告)号:CN118864291A

    公开(公告)日:2024-10-29

    申请号:CN202410827420.0

    申请日:2024-06-25

    Abstract: 本发明公开了基于联合条件扩散模型的混合退化图像复原方法,涉及图像复原技术领域,是一种两阶段式混合退化图像复原方法,包括基于联合条件扩散模型的预复原阶段和基于不确定性估计网络的微调复原阶段。基于物理大气散射模型,建立了混合天气退化模型,该模型可作为产生混合天气退化的基础模型。在初步复原阶段,构建了基于物理约束的联合条件扩散模型,该模型引入退化图像和退化掩码作为引导图像恢复过程的条件。在微调复原阶段,利用不确定性估计模块增强对于图像颜色和细节的恢复。相比于针对单一已知退化类型的图像复原方法,本方法无需对退化类型做出先验假设;且相比于盲源图像分解方法,本方法无需明确地识别或分离单个退化因素,有效解决了当退化类型未知且混合多样时的图像复原问题。

Patent Agency Ranking