基于多源数据融合的高分遥感影像语义分割模型及方法

    公开(公告)号:CN113255676A

    公开(公告)日:2021-08-13

    申请号:CN202110556336.6

    申请日:2021-05-21

    Applicant: 福州大学

    Abstract: 本发明提出一种基于多源数据融合的高分遥感影像语义分割模型及方法,其特征在于:基于编码器‑解码器结构,通过并行的双分支孪生网络完成特征提取,使用空间通道注意力模块用于增强模块之间的关系,并使用Dupsampling进行上采样恢复特征。在ISPRS数据集上对提出的模型进行了评估。实验结果表明,MSDFM的性能优于大多数其他相关模型。特别是对于小目标可以有很好的分辨效果,在Vaihingen数据集中对于车辆的识别精度达到93.63%,达到当前最佳的效果。

    一种适用于重定向图像质量评估的视觉注意融合方法

    公开(公告)号:CN108549872A

    公开(公告)日:2018-09-18

    申请号:CN201810342794.8

    申请日:2018-04-17

    Applicant: 福州大学

    Abstract: 本发明涉及一种适用于重定向图像质量评估的视觉注意融合方法,包括以下步骤:1、读取原始图像,使用两种显著物体检测算法生成两种显著性图;2、使用均衡化操作减小两种显著性图的分布差异,生成两幅均衡化显著性图;3、使用对应点的显著性值相加求平均的方法融合两幅均衡化显著性图,经归一化操作生成融合显著性图;4、检测原始图像中的人脸和线条信息;5、在约束放大极值的条件下,自适应地放大融合显著性图中的人脸矩形框和线条区域的显著性值,生成包含人脸和线条信息的融合显著性图;6、使用显著性增强模型增加融合显著性图的对比度,经归一化操作生成视觉注意融合显著性图。该方法能够提高客观质量评估结果与主观感知的一致性。

    基于涂鸦模拟的交互式红外睑板腺图像分割方法

    公开(公告)号:CN119379655A

    公开(公告)日:2025-01-28

    申请号:CN202411527213.X

    申请日:2024-10-30

    Applicant: 福州大学

    Abstract: 本发明提出一种基于涂鸦模拟的交互式红外睑板腺图像分割方法;该方法设计了一种新型的多任务网络架构,接收多种交互信息(点击和涂鸦)作为输入,实现腺体分割,并预测其假阳性和假阴性区域用于指导模型进行涂鸦模拟。该方法采用二阶段网络训练策略,结合不确定性区域简化掩码以提高错误区域预测的准确性。对于每轮用户交互,该方法分两个阶段执行预测。第一阶段,网络基于用户点击输出粗略分割掩码及对应的假阳性和假阴性预测区域;第二阶段,模型基于这两个错误区域根据伪涂鸦生成策略模拟涂鸦以细化第一阶段输出的粗略分割掩码。对比现有方法,本方法能同时兼顾涂鸦的高效性和用户交互的简便性,进一步降低用户劳动成本。

    双模态融合与校正的遥感图像语义分割方法

    公开(公告)号:CN118710905A

    公开(公告)日:2024-09-27

    申请号:CN202410841491.6

    申请日:2024-06-27

    Applicant: 福州大学

    Abstract: 本发明涉及双模态融合与校正的遥感图像语义分割方法。首先多源高分光学图像和nDSM图像组成的样本对分别输入到网络的对应两个分支。模型的双分支结构对两个模态进行四个阶段的特征提取和通道与空间融合校正,产生阶段性增强特征与阶段性融合特征。第一个阶段的特征提取结果还用于模态互补边界的提取,以得到多尺度边界特征。多尺度边界特征和不同尺度的阶段性融合特征用于逐步的融合与上采样,以得到最终的语义分割结果与边界分割结果。本发明的模型能根据模态差异处理光学图像与nDSM数据,充分利用多模态互补信息实现特征校正与融合,细化边界,强化多尺度特征,有效缓解了高分遥感图像的语义分割任务中光谱混淆和类内差异大、类间差异小的问题。

    基于频域动态卷积和Conformer的声源定位方法

    公开(公告)号:CN118655523A

    公开(公告)日:2024-09-17

    申请号:CN202410909950.X

    申请日:2024-07-08

    Applicant: 福州大学

    Abstract: 本发明提供一种基于频域动态卷积和Conformer的声源定位方法,首先对麦克风阵列捕获的多通道音频进行对数幅度谱和相位谱的计算,并进行串联融合。将融合后的特征输入CNN‑Conformer网络中,网络输出直接路径相位差,然后通过网络输出的直接路径相位差计算空间响应功率谱,最后对空间响应功率谱进行谱峰搜索得到最终的声源位置。本发明的模型将频域动态CNN和Conformer模块结合,能够释放卷积在频率维度上的平移等变性,缓解了时频谱图中不同频率对应相位差不同导致的定位误差,还可有效地捕获时频谱图中的时间‑频率模式和长期依赖关系。相比已有的CRNN模型,该方法拥有更强的空间特征捕获能力,能够有效提高声源定位精度。

    多层次自适应知识蒸馏的轻量化高分遥感场景分类方法

    公开(公告)号:CN115187863A

    公开(公告)日:2022-10-14

    申请号:CN202210837954.2

    申请日:2022-07-16

    Applicant: 福州大学

    Abstract: 本发明提供了一种多层次自适应知识蒸馏的轻量化高分遥感场景分类方法,包括以下步骤:步骤S1:将遥感图像数据分别送入教师模型和学生模型进行特征提取;步骤S2:将教师模型和学生模型提取的特征分别送入分类器,通过自适应温度机制对温度进行调整后,将概率分布输出进行蒸馏学习;步骤S3:将教师模型和学生模型提取的特征分别生成对应的空;步骤S4:将教师模型和学生模型提取的特征分别生成对应的通道间相关性,并从教师模型与学生模型的特征的通道间相关性进行蒸馏学习。应用本技术方案能够自适应调整知识蒸馏过程中输出层的蒸馏温度,使得学生模型有选择地学习教师模型的输出层概率分布知识。

    基于VIT的面向高光谱遥感图像分类径向累加位置编码系统

    公开(公告)号:CN114037899A

    公开(公告)日:2022-02-11

    申请号:CN202111453939.X

    申请日:2021-12-01

    Applicant: 福州大学

    Abstract: 本发明涉及一种基于VIT的面向高光谱遥感图像分类径向累加位置编码系统,包括:数据提取预处理模块,用于从数据集中截取数据,通过PCA主成分分析预处理,并将处理后的数据输入到模型框架中;位置编码模块,将输入的数据从中心点往四周叠加,使每个点的数据附带位置信息;数据拆分模块,将数据划分成多个块状区域,并分别拉伸成一维向量,输入到ViT模型中;主体模型模块,包含一个ViT模型,用于处理输入的数据,输出分类结果。本发明使输入到ViT的数据得以附加更加有效的空间信息,从而提升像素级分类精度。

    基于预采样和渐进式语义建模策略的室内场景重建方法

    公开(公告)号:CN119784941A

    公开(公告)日:2025-04-08

    申请号:CN202411836821.9

    申请日:2024-12-13

    Applicant: 福州大学

    Abstract: 本发明涉及一种基于预采样和渐进式语义建模策略的室内场景重建方法;包括以下步骤:构建场景重建模型,场景重建模型包括DFormer模块、主模型模块和语义建模模块;基于NYUv2数据集训练所构建的场景重建模型;将待重建的RGB图像和对应的深度图输入训练好的场景重建模型;主模型模块对输入的RGB图像和对应的深度图进行场景的渲染预采样,获取粗略的体积密度估计,并进行正式的体积和颜色渲染;DFormer模块将RGB图像转换成语义图像;语义建模模块以语义图像及对应的深度图作为输入,通过渐进式语义建模策略辅助细化体积和颜色的渲染效果;实现室内场景的重建。本发明能够显著提升场景重建的效率和精度,实现更精确的细节还原和更高效的渲染过程。

Patent Agency Ranking