3D目标检测模型的训练方法、3D目标检测方法及装置

    公开(公告)号:CN114972136A

    公开(公告)日:2022-08-30

    申请号:CN202110215194.7

    申请日:2021-02-25

    Abstract: 本申请提供了一种3D目标检测模型的训练方法、3D目标检测方法及装置,涉及计算机视觉领域。该训练方法包括:获取训练样本,基于训练样本对3D目标检测模型进行训练,得到训练好的3D目标检测模型,训练样本包括目标点云帧和目标图像帧,目标点云帧和目标图像帧是通过对初始图像帧和初始点云帧进行模态同步的重采样,并通过物体间的遮挡关系分别处理重采样后的点云帧和图像帧得到的,本申请实施例的方案能够对初始点云帧和初始图像帧进行增强,提高训练样本的多样性,有利于提高训练得到的3D目标检测模型的性能。

    一种数据处理方法及其装置
    2.
    发明公开

    公开(公告)号:CN117251592A

    公开(公告)日:2023-12-19

    申请号:CN202311071646.4

    申请日:2023-08-23

    Abstract: 一种数据处理方法,涉及人工智能领域,包括:获取图像以及对象检测请求,所述对象检测请求包含针对于所述图像中待检测对象的自然语言描述;通过图像编码器,处理所述图像,得到多个图像区域中每个图像区域的特征表示,每个图像区域对应于一个候选的检测框;通过语言模型,处理所述对象检测请求和多个所述特征表示,从所述多个图像区域中确定所述待检测对象所在的区域和类别。本申请利用图像编码器得到细粒度特征,也就是每个图像区域的特征,并结合语言模型进行目标检测,可以提高对于细粒度特征的处理能力,提高人类语言指引下的目标检测的精度。

    目标检测方法及装置
    3.
    发明公开

    公开(公告)号:CN116466320A

    公开(公告)日:2023-07-21

    申请号:CN202310297687.9

    申请日:2023-03-17

    Abstract: 本申请涉及一种目标检测方法及装置,该方法包括:对激光雷达获取到的点云数据按照极坐标进行体素化处理,得到处理后数据;对处理后数据进行特征提取,得到第一2D特征图;基于全局信息交互对齐所述第一2D特征图,得到第二2D特征图;对第二2D特征图进行2D特征提取,得到第一2D特征信息;基于第一2D特征信息的几何信息和实例级信息对第一2D特征信息进行调整聚合,得到第二2D特征信息;基于第二2D特征信息进行目标检测,得到检测结果。本申请能进行全局特征信息的交互,减少全局交互的计算量,并让特征信息对齐。在特征信息提取后,还能在特征中引入几何线索和物体级别信息,提高回归能力。

    一种数据处理方法及其装置
    4.
    发明公开

    公开(公告)号:CN116861850A

    公开(公告)日:2023-10-10

    申请号:CN202310751865.0

    申请日:2023-06-21

    Abstract: 一种数据处理方法,应用于人工智能领域,包括:获取第一特征表示、第二特征表示和第三特征表示;第一特征表示包括通过扩散模型中的加噪模块对原始文本特征进行第一步长的加噪后得到的特征表示;第二特征表示为第一步长的特征表示;第三特征表示为第一图像的特征表示;根据第一特征表示、第二特征表示和第三特征表示,通过扩散模型中的去噪模块对原始文本特征进行预测,得到第四特征表示;根据第四特征表示,通过对比学习,更新去噪模块。本申请将图文对比学习转化为以图像为条件的文本生成过程,使得实现图像生成的模型和实现图文对比学习的模型之间参数共享,从而实现了在一套框架中实现图文对齐和图像生成,降低了部署的存储开销和计算开销。

    一种点云数据的处理方法及相关装置

    公开(公告)号:CN116468903A

    公开(公告)日:2023-07-21

    申请号:CN202310328338.9

    申请日:2023-03-23

    Abstract: 一种点云数据的处理方法,应用于人工智能技术领域。在该方法中,基于针对相同对象采集得到的点云数据和图像,先识别得到图像中所包括的对象,再通过点云数据和图像之间的映射关系,确定点云数据中与图像中的对象所对应的点云簇。这样,在模型训练阶段,可以通过模型提取同一对象所对应的点云簇以及文本的特征,实现点云数据特征和文本特征的对比学习训练,保证后续能够基于训练得到的模型实现点云数据中物体的识别。

    一种语言模型推理方法以及推理装置

    公开(公告)号:CN119692457A

    公开(公告)日:2025-03-25

    申请号:CN202311212066.2

    申请日:2023-09-19

    Abstract: 提供了一种语言模型的推理方法以及推理装置。该方法包括:根据第四问题生成第五问题,所述第五问题用于提问所述第四问题、以及提示语言模型回答所述第四问题的回复中不要包括预设内容;所述语言模型根据所述第五问题输出第三回复,所述第三回复不包括所述预设内容。其中,所述语言模型的参数根据第一回复的评价数据更新,所述语言模型根据第一问题输出所述第一回复,所述评价数据用于指示所述第一回复是否包括所述预设内容。该方法可以提高语言模型对预设内容的理解能力,从而更准确地抑制模型输出预设内容。

Patent Agency Ranking