基于视觉大模型的全场景地物分割的处理方法及系统

    公开(公告)号:CN119693823A

    公开(公告)日:2025-03-25

    申请号:CN202411725983.5

    申请日:2024-11-28

    Abstract: 本发明公开了基于视觉大模型的全场景地物分割的处理方法及系统,属于计算机视觉技术领域。包括以下步骤:获取无人机拍摄的视频数据,对视频中图像数据进行预处理;通过预设信息,使用Grounding DINO检测图像数据中的类别,使用SAM分割模型获取检测到的框的实例分段掩码;使用CLIPSeg获取类别的一次分割掩码;在一次割掩码中确定采样点,并将采样点输入至SAM分割模型以获得类别的二次分割掩码;将一次分割掩码与二次分割掩码结合,得到全景分割结果。相较于现有技术,本发明的有益之处在于,解决了传统SAM分割模型不具备物体之间文本识别和语义分析能力,实现了根据提示词进行无人机视角图片的全场景分割。

    一种基于无人机倾斜摄影的目标定位方法

    公开(公告)号:CN118896593B

    公开(公告)日:2025-02-18

    申请号:CN202411356664.1

    申请日:2024-09-27

    Abstract: 本申请公开了一种基于无人机倾斜摄影的目标定位方法,涉及无人机摄影领域,包括:构建基于神经网络的目标检测模型,输出目标在相片中的像素坐标,以及相片中心点的像素坐标;获取无人机和相机的状态参数;将目标的像素坐标和相片中心点的像素坐标,分别转换为目标像平面坐标(x,y)和相片中心点像平面坐标;采用UTM投影或高斯‑克吕格投影将无人机的经纬度转换为投影坐标;根据相片中心点的像素坐标,计算相片中心点在地面的投影坐标;计算目标在地面投影坐标系下的坐标;采用UTM反投影或高斯‑克吕格反投影,将目标在地面投影坐标系下的坐标转换为目标在地面的经纬度坐标;针对现有技术中无人机摄影测量精度低,本申请提高了精度。

    一种基于无人机倾斜摄影的目标定位方法

    公开(公告)号:CN118896593A

    公开(公告)日:2024-11-05

    申请号:CN202411356664.1

    申请日:2024-09-27

    Abstract: 本申请公开了一种基于无人机倾斜摄影的目标定位方法,涉及无人机摄影领域,包括:构建基于神经网络的目标检测模型,输出目标在相片中的像素坐标,以及相片中心点的像素坐标;获取无人机和相机的状态参数;将目标的像素坐标和相片中心点的像素坐标,分别转换为目标像平面坐标(x,y)和相片中心点像平面坐标;采用UTM投影或高斯‑克吕格投影将无人机的经纬度转换为投影坐标;根据相片中心点的像素坐标,计算相片中心点在地面的投影坐标;计算目标在地面投影坐标系下的坐标;采用UTM反投影或高斯‑克吕格反投影,将目标在地面投影坐标系下的坐标转换为目标在地面的经纬度坐标;针对现有技术中无人机摄影测量精度低,本申请提高了精度。

Patent Agency Ranking