基于视觉大模型的全场景地物分割的处理方法及系统

    公开(公告)号:CN119693823A

    公开(公告)日:2025-03-25

    申请号:CN202411725983.5

    申请日:2024-11-28

    Abstract: 本发明公开了基于视觉大模型的全场景地物分割的处理方法及系统,属于计算机视觉技术领域。包括以下步骤:获取无人机拍摄的视频数据,对视频中图像数据进行预处理;通过预设信息,使用Grounding DINO检测图像数据中的类别,使用SAM分割模型获取检测到的框的实例分段掩码;使用CLIPSeg获取类别的一次分割掩码;在一次割掩码中确定采样点,并将采样点输入至SAM分割模型以获得类别的二次分割掩码;将一次分割掩码与二次分割掩码结合,得到全景分割结果。相较于现有技术,本发明的有益之处在于,解决了传统SAM分割模型不具备物体之间文本识别和语义分析能力,实现了根据提示词进行无人机视角图片的全场景分割。

    一种基于大模型和知识图谱的信息处理方法及系统

    公开(公告)号:CN119226535A

    公开(公告)日:2024-12-31

    申请号:CN202411746717.0

    申请日:2024-12-02

    Abstract: 本发明公开了一种基于大模型和知识图谱的信息处理方法及系统,属于信息处理技术领域。包括以下步骤:通过结构化信息知识抽取、半结构化信息知识抽取以及非结构化信息知识抽取,从数据源中抽取知识信息;将抽取出知识信息中的实体信息及关系信息整合,构建知识图谱;将知识图谱中的任务转换为提示词的形式输入到大模型进行微调,得到微调后的大模型;结合知识图谱和微调后的大模型进行信息检索并生成结果。相较于现有技术,本发明的有益之处在于,结合包含丰富的实体和关系信息的知识图谱,使得处理过程中能够覆盖更广泛的知识领域,结合大语言模型的生成能力,实现生成更加多样化和更加全面的更准确的检索结果。

Patent Agency Ranking