一种针对野外场景的多模态三维语义占用预测方法及其系统

    公开(公告)号:CN119580221A

    公开(公告)日:2025-03-07

    申请号:CN202411623204.0

    申请日:2024-11-14

    Inventor: 翟恒 梅继林 胡瑜

    Abstract: 本申请公开了一种针对野外场景的多模态三维语义占用预测方法,方法包括:基于带有语义信息的多帧点云数据,生成三维语义占据标签;采集野外场景下的多模态传感数据,进行传感数据的特征提取与历史帧叠加,利用知识蒸馏函数将提取的点云特征中的几何知识传递至图像分支网络,将提取的图像与点云的特征进行动态融合,输出融合特征;使用三维卷积构建的占用预测头将融合特征进行转化,生成三维语义占用的预测值,实现野外场景的自动重建。本发明实现三维语义占用标签的生成,显著减少了重建场景的误差,且填补野外场景下三维语义占用预测方法的空缺。

    基于视觉模型SAM的停车区域检测方法及装置

    公开(公告)号:CN119007159A

    公开(公告)日:2024-11-22

    申请号:CN202410405638.7

    申请日:2024-04-03

    Inventor: 梅继林 翟恒 胡瑜

    Abstract: 本发明提出一种基于视觉模型SAM的停车区域检测方法,包括:通过视觉模型SAM将车辆周边的俯视环视图像分割为具有多个掩码的分割结果;对该分割结果进行过滤,筛选出包含停车区域信息的有效掩码;使用预定义规则获取该有效掩码中的标记点,根据该标记点获取该停车区域信息。本发明还提出一种基于视觉模型SAM的停车区域检测装置,以及一种计算机可读存储介质和一种电子设备。本发明的停车区域检测方法,通过利用SAM模型的强大零样本迁移能力,在多样化的环境和复杂的背景条件下,对环视图像进行智能分析与处理,无需特定的停车区域标注数据和额外的训练数据,即可实现对停车区域的有效检测与定位,适用于自动驾驶系统中的泊车辅助功能。

Patent Agency Ranking