一种基于改进Swin-Transformer的水下图像增强方法

    公开(公告)号:CN117876226A

    公开(公告)日:2024-04-12

    申请号:CN202410041035.3

    申请日:2024-01-09

    Abstract: 本发明公开了一种基于改进Swin‑Transformer的水下图像增强方法。考虑到水下图像增强任务往往存在模糊、对比度低以及颜色偏移等问题。为此本发明提出了一种“编码‑解码”架构的水下图像增强方法。该方法通过在编码器的输入端设计边缘信息融合模块,引导特征提取过程对边缘信息的关注,提升增强图像的对比度。其次,设计空间自适应Swin‑Transformer模块作为编码器与解码器的基础单元,抑制模糊因素的干扰。最后,在输出端设计分通道颜色校正模块,改善颜色偏移现象。本发明的优势在于,相较于前沿水下图像增强方法,本方法在具有较好视觉感知效果以及泛化能力,更加适用于纷繁复杂的水下图像增强任务。

    一种基于Mamba多特征增强融合的水下图像增强方法

    公开(公告)号:CN119809951A

    公开(公告)日:2025-04-11

    申请号:CN202411890988.3

    申请日:2024-12-20

    Abstract: 本发明提出了一种结合高频增强、空间‑频率混合特征提取以及Mamba增强融合技术的水下图像增强方法。该方法旨在解决水下图像在光传播过程中因吸收和散射效应导致的低对比度、颜色失真和细节丧失等问题,提升图像质量,改善视觉感知效果。具体包括四个主要步骤:首先,获取并预处理水下不同场景的初始数据集;然后,通过纹理增强模块提取图像的纹理细节信息;接着,利用空间‑频率混合特征提取模块进一步增强纹理细节;最后,结合原始图像、纹理信息及空间频域增强结果,通过Mamba增强融合模块实现图像的特征融合,从而有效恢复水下图像的细节,纠正颜色偏差,提升图像的清晰度与视觉效果。本发明的方法能够提高水下图像在复杂环境中的增强性能,为水下探测、目标检测、物体识别及图像分割等应用提供有力支持。

    基于上下文感知的车载音乐交互系统

    公开(公告)号:CN119597958A

    公开(公告)日:2025-03-11

    申请号:CN202411633466.5

    申请日:2024-11-15

    Abstract: 本发明属于车载人机交互技术领域,具体涉及一种基于上下文感知的车载音乐推荐系统,涵盖计算机视觉、推荐系统和人机交互等技术。系统整体分为两个主要部分:第一部分为上下文信息收集模块,该模块通过采集驾驶员的面部图像和语音信息,实现对驾驶员情绪的实时识别。第二部分是反馈模块,用于处理驾驶员与不同情绪分析结果之间的交互,包含映射规则推理和音乐推荐。通过分析驾驶员的面部表情和语音信息所提取的情绪特征,系统生成个性化的音乐推荐列表,旨在减轻驾驶员的音乐选择负担,预防极端情绪的发生,从而对保障驾驶员的人身安全及道路交通安全具有重要意义。

Patent Agency Ranking