一种基于自然语言指令的三维点云场景目标定位方法

    公开(公告)号:CN118229782A

    公开(公告)日:2024-06-21

    申请号:CN202410325018.2

    申请日:2024-03-21

    Abstract: 本发明涉及人工智能与计算机视觉领域,提供了一种基于自然语言指令的三维点云场景目标定位方法,包括:筛选出包含三维视觉场景中物体类别的关系三元组;确定物体类别的层级属性,构建层次化知识图谱;对给定的自然语言描述进行解析,获得多个两阶语义三元组;对两阶语义三元组中的物体增加层级属性,获得层次化两阶语义三元组;确定待识别三维点云场景中物体的初始视觉特征;输出物体的预测得分;从高到低筛选出多个预测得分对应的物体,作为候选物体;输出候选物体与第一高阶语义三元组的匹配得分;确定待识别三维点云场景中的目标物体。本发明提高了预测精度,且具有更强的鲁棒性。

Patent Agency Ranking