-
公开(公告)号:CN114419390B
公开(公告)日:2025-05-13
申请号:CN202111604280.3
申请日:2021-12-24
Applicant: 北京三快在线科技有限公司
IPC: G06V10/774 , G06N20/00
Abstract: 本发明实施例提供了一种目标对象的预测方法和装置,其中,所述方法包括:将原始图像输入至第一检测模型,输出目标对象的第一位置信息和粗略类别信息;对原始图像进行裁剪得到多个目标对象区域图像,将多个目标对象区域图像输入至第二检测模型,输出每个目标对象的多个第二位置信息和多个精细类别信息;若存在目标类别对象则选择出目标预测对象;根据第一位置信息和第二位置信息生成位置预测结果,将精细类别信息作为类别预测结果。本发明实施例增加了目标对象的上下文信息,从而提高从第二检测模型输出的精细类别信息的准确率。针对目标类别对象选择出目标预测对象,避免了非目标预测对象的干扰,进一步提升目标对象预测的准确率。
-
公开(公告)号:CN115205628A
公开(公告)日:2022-10-18
申请号:CN202210769935.0
申请日:2022-06-30
Applicant: 北京三快在线科技有限公司
IPC: G06V10/774 , G06V10/772 , G06V10/764 , G06V10/26 , G06V10/40 , G06V10/74
Abstract: 本申请公开了一种视觉感知模型训练方法、装置、设备及存储介质,属于计算机视觉技术领域。该方法先获取多个单实例样本图像,然后对每个单实例样本图像分别进行第一数据增强处理和第二数据增强处理,得到第一处理图像和第二处理图像,对从多个单实例样本图像中选取的M个单实例样本图像进行拼接处理,得到多实例样本图像,分别对第一处理图像、多实例样本图像、第二处理图像和M个单实例样本图像进行特征提取,得到对应的图像特征,基于这些图像特征,进行模型训练,得到视觉感知模型。由于训练模型的图像特征不仅包括单实例样本图像的图像特征,还包括多实例样本图像的图像特征,因此,可以提高模型的泛化能力。
-
公开(公告)号:CN114429602A
公开(公告)日:2022-05-03
申请号:CN202210006151.2
申请日:2022-01-04
Applicant: 北京三快在线科技有限公司
Abstract: 本申请实施例提供了语义分割方法、装置、电子设备及存储介质方法,该方法包括:提取视频的多帧中的每一帧的原始特征,多帧包括:当前帧、至少一个先前帧,先前帧位于当前帧之前;将每一帧的原始特征输入到语义分割模型中,得到当前帧的语义分割结果,语义分割模型被配置为:基于每一帧的原始特征,确定每一帧的用于对齐的特征;对于每一个先前帧,基于该先前帧的用于对齐的特征与当前帧的用于对齐的特征,对该先前帧的用于对齐的特征进行可变形卷积,得到该先前帧的对齐空间特征,基于当前帧的用于对齐的特征、每一先前帧的对齐空间特征,得到当前帧的对齐运动特征;基于该对齐运动特征,预测当前帧的语义分割结果。
-
公开(公告)号:CN111400533A
公开(公告)日:2020-07-10
申请号:CN202010136046.1
申请日:2020-03-02
Applicant: 北京三快在线科技有限公司
IPC: G06F16/583 , G06K9/00 , G06N3/04
Abstract: 本申请公开了图像筛选方法、装置、电子设备和存储介质。所述方法包括:获取待筛选的多帧图像,其中,各帧图像分别带有对象标注信息和帧序;根据所述对象标注信息和帧序,确定目标对象的关联图像序列;对所述关联图像序列进行对象类别识别,得到所述关联图像序列的待校验类别;在所述待校验类别与所述目标对象匹配的情况下,根据所述关联图像序列筛选出包含所述目标对象的最优图像。有益效果在于,仅依赖图像的标注信息和帧序就可以完成图像的去重,可以应用于地图制作领域对地图外业采集数据的筛选,准确聚合同一路段的重复信息,区别于传统方案,不再依赖于GPS等位置信息对图像进行筛选,摆脱了GPS的位置偏差较大的问题。
-
公开(公告)号:CN114283395A
公开(公告)日:2022-04-05
申请号:CN202210016475.4
申请日:2022-01-07
Applicant: 北京三快在线科技有限公司
IPC: G06V20/56 , G06V10/40 , G06V10/764 , G06V10/766 , G06V10/82 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本申请公开了一种车道线检测的方法、装置、设备及计算机可读存储介质,属于自动驾驶技术领域。该方法包括:提取待检测图像的第一特征;基于图像的第一特征预测图像中的消失点和车道线,基于预测结果得到图像的消失点掩码和车道线掩码;基于消失点掩码和车道线掩码获取车道线的中心线和偏移量;利用中心线和偏移量确定出图像中的车道线。本方法基于消失点掩码和车道线掩码得到车道线的中心线和偏移量,使得图像中的消失点的信息和车道线的像素信息得到利用,基于车道线的中心线和偏移量来预测车道线,使得检测车道线的效率更高,准确度也更高。
-
公开(公告)号:CN113920222B
公开(公告)日:2025-03-25
申请号:CN202111069336.X
申请日:2021-09-13
Applicant: 北京三快在线科技有限公司
IPC: G06T11/60 , G06V10/74 , G06V10/82 , G06T3/04 , G06N3/0464 , G06N3/0475 , G06N3/045 , G06N3/094
Abstract: 本申请公开了获取地图建图数据的方法、装置、设备及可读存储介质,属于图像处理技术领域。所述方法包括:基于第一图像数据的第一标签获取符合任务需求的第二标签;基于第二标签生成与第一图像数据匹配的第二图像数据;基于第二图像数据训练得到第一神经网络模型;通过第一神经网络模型对第三图像数据进行风格迁移,得到地图建图数据。本申请即使在第一图像数据缺少的情况下,也仍然能够利用生成的第二图像数据进行模型训练,提高了训练得到的神经网络模型的性能,因此,基于该第一神经网络模型对第三图像数据进行风格迁移时,得到的地图建图数据的图像质量更高,且提高了准确率。
-
公开(公告)号:CN114429602B
公开(公告)日:2025-03-18
申请号:CN202210006151.2
申请日:2022-01-04
Applicant: 北京三快在线科技有限公司
IPC: G06V20/40 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本申请实施例提供了语义分割方法、装置、电子设备及存储介质方法,该方法包括:提取视频的多帧中的每一帧的原始特征,多帧包括:当前帧、至少一个先前帧,先前帧位于当前帧之前;将每一帧的原始特征输入到语义分割模型中,得到当前帧的语义分割结果,语义分割模型被配置为:基于每一帧的原始特征,确定每一帧的用于对齐的特征;对于每一个先前帧,基于该先前帧的用于对齐的特征与当前帧的用于对齐的特征,对该先前帧的用于对齐的特征进行可变形卷积,得到该先前帧的对齐空间特征,基于当前帧的用于对齐的特征、每一先前帧的对齐空间特征,得到当前帧的对齐运动特征;基于该对齐运动特征,预测当前帧的语义分割结果。
-
公开(公告)号:CN111400533B
公开(公告)日:2023-10-17
申请号:CN202010136046.1
申请日:2020-03-02
Applicant: 北京三快在线科技有限公司
IPC: G06F16/583 , G06V20/60 , G06V20/70 , G06V10/764 , G06V10/82
Abstract: 本申请公开了图像筛选方法、装置、电子设备和存储介质。所述方法包括:获取待筛选的多帧图像,其中,各帧图像分别带有对象标注信息和帧序;根据所述对象标注信息和帧序,确定目标对象的关联图像序列;对所述关联图像序列进行对象类别识别,得到所述关联图像序列的待校验类别;在所述待校验类别与所述目标对象匹配的情况下,根据所述关联图像序列筛选出包含所述目标对象的最优图像。有益效果在于,仅依赖图像的标注信息和帧序就可以完成图像的去重,可以应用于地图制作领域对地图外业采集数据的筛选,准确聚合同一路段的重复信息,区别于传统方案,不再依赖于GPS等位置信息对图像进行筛选,摆脱了GPS的位置偏差较大的问题。
-
公开(公告)号:CN112699893A
公开(公告)日:2021-04-23
申请号:CN202110033686.4
申请日:2021-01-11
Applicant: 北京三快在线科技有限公司
Abstract: 本公开提供了一种图像识别模型训练方法及装置。所述方法包括:将样本数据输入至预训练的图像识别模型;调用深层特征处理层对所述图像进行处理,得到图像对应的深层特征信息;调用细节特征引导层根据图像真值对图像进行处理,得到图像对应的细节特征值,并根据细节特征值确定细节特征引导层对应的细节损失值;在细节损失值处于第一预设范围内的情况下,将深层特征信息和细节特征值进行融合处理,得到图像对应的预测分类结果;根据初始分类结果和预测分类结果,计算得到图像识别模型的损失值;在损失值处于第二预设范围内的情况下,将训练后的图像识别模型作为目标图像识别模型。本公开可以使得网络能够更充分的编码空间信息,在提升语义分割性能的同时,不会引入额外的计算量消耗,更不会影响模型的推理速度。
-
公开(公告)号:CN113887608B
公开(公告)日:2023-03-24
申请号:CN202111143124.1
申请日:2021-09-28
Applicant: 北京三快在线科技有限公司
IPC: G06V10/774 , G06V10/25 , G06V10/764 , G06V10/80 , G06N3/045 , G06N3/0464 , G06N3/047 , G06N3/09
Abstract: 本说明书公开了一种模型训练的方法、图像检测的方法及装置,首先,获取样本图像。其次,将样本图像输入到待训练的预测模型,确定样本图像中涉及指定目标物的至少一个候选图像区域以及原始特征。而后,筛选出包含其他目标物的待处理区域,并根据其他目标物的图像在待处理区域中的位置,得到待处理区域对应的补偿特征。最后,根据待处理区域对应的补偿特征以及其他候选图像区域对应的原始特征,得到目标物检测结果,并以最小化目标物检测结果与样本图像中针对指定目标物的标签信息之间的偏差为优化目标,对预测模型进行训练。本方法可以在确定指定目标物所在区域时,避免将其他目标物所在区域检测为指定目标物区域,提高了预测模型的识别准确率。
-
-
-
-
-
-
-
-
-