-
公开(公告)号:CN110222569B
公开(公告)日:2021-04-23
申请号:CN201910368598.2
申请日:2019-05-05
Applicant: 北京三快在线科技有限公司
Abstract: 本公开公开了一种对象检测方法,包括:通过预设的外观形状检测模型,检测目标图片中所包含的与预设的外观形状类型匹配的检测对象;根据所述检测对象的位置信息,提取所述检测对象的特征信息;根据所述特征信息,以及预设的特征数据库,确定所述检测对象的所属类别。解决了现有的对象检测方案在每添加一个新品类时,都需要采集新品类的样本重新训练模型,扩展性较差,训练成本较高的技术问题。取得了提高模型适应性以及扩展性,降低检测成本的有益效果。
-
公开(公告)号:CN112686267A
公开(公告)日:2021-04-20
申请号:CN202110033687.9
申请日:2021-01-11
Applicant: 北京三快在线科技有限公司
Abstract: 本公开提供了一种图像语义分割方法及装置。包括:将待处理图像输入至图像识别模型;图像识别模型包括:短时密集连接网络层和解码网络层,短时密集连接网络层包括:卷积模块、多个短时密集连接层和输出模块,短时密集连接层包含多个短时密集连接模块;调用卷积模块对待处理图像进行处理得到待处理图像对应的第一特征图;调用短时密集连接层对第一特征图进行处理得到第二特征图;调用输出模块对第二特征图进行处理得到第三特征图;调用解码网络层对第三特征图进行上采样并向分割类别映射,得到通道数为分割类别数的第四特征图;根据第四特征图确定待处理图像对应的语义分割结果。本公开可以减少网络结构性冗余,提高图像语义分割性能和效率。
-
公开(公告)号:CN111401359A
公开(公告)日:2020-07-10
申请号:CN202010116980.7
申请日:2020-02-25
Applicant: 北京三快在线科技有限公司
Abstract: 本申请公开了目标识别方法、装置、电子设备和存储介质。所述方法包括:获取待识别图像;对所述待识别图像进行位置识别,得到位置识别结果,并根据位置识别结果确定所述待识别图像的候选区域集合;对候选区域集合中的各候选区域进行目标类别识别,得到类别识别结果。有益效果在于,将目标位置的识别与目标类别的的识别作为两个阶段,利用多个候选区域进行目标类别的识别,能够更充分地利用待识别图像中的有效信息,提高类别识别的精确度,提高目标识别的效果。
-
公开(公告)号:CN114419390B
公开(公告)日:2025-05-13
申请号:CN202111604280.3
申请日:2021-12-24
Applicant: 北京三快在线科技有限公司
IPC: G06V10/774 , G06N20/00
Abstract: 本发明实施例提供了一种目标对象的预测方法和装置,其中,所述方法包括:将原始图像输入至第一检测模型,输出目标对象的第一位置信息和粗略类别信息;对原始图像进行裁剪得到多个目标对象区域图像,将多个目标对象区域图像输入至第二检测模型,输出每个目标对象的多个第二位置信息和多个精细类别信息;若存在目标类别对象则选择出目标预测对象;根据第一位置信息和第二位置信息生成位置预测结果,将精细类别信息作为类别预测结果。本发明实施例增加了目标对象的上下文信息,从而提高从第二检测模型输出的精细类别信息的准确率。针对目标类别对象选择出目标预测对象,避免了非目标预测对象的干扰,进一步提升目标对象预测的准确率。
-
公开(公告)号:CN116311157A
公开(公告)日:2023-06-23
申请号:CN202310180237.1
申请日:2023-02-15
Applicant: 北京三快在线科技有限公司
IPC: G06V20/58 , G06V10/80 , G06V10/762 , G06V10/774
Abstract: 本申请公开了一种障碍物识别方法、障碍物识别模型训练方法,属于自动驾驶技术领域。方法包括:获取目标场景的图像;通过闭集识别模型,对所述图像进行识别,得到第一识别结果,所述闭集识别模型用于识别学习到的已知类别的障碍物图像,所述第一识别结果包括识别到的障碍物图像以及所述障碍物图像的类别;通过开集识别模型,对所述图像进行识别,得到第二识别结果,所述开集识别模型用于基于学习到的已知类别的障碍物图像识别未知类别的障碍物图像,所述第二识别结果包括识别到的障碍物图像;将所述第一识别结果和所述第二识别结果进行融合,得到第三识别结果。该方法提高了识别结果的准确性。
-
公开(公告)号:CN115205628A
公开(公告)日:2022-10-18
申请号:CN202210769935.0
申请日:2022-06-30
Applicant: 北京三快在线科技有限公司
IPC: G06V10/774 , G06V10/772 , G06V10/764 , G06V10/26 , G06V10/40 , G06V10/74
Abstract: 本申请公开了一种视觉感知模型训练方法、装置、设备及存储介质,属于计算机视觉技术领域。该方法先获取多个单实例样本图像,然后对每个单实例样本图像分别进行第一数据增强处理和第二数据增强处理,得到第一处理图像和第二处理图像,对从多个单实例样本图像中选取的M个单实例样本图像进行拼接处理,得到多实例样本图像,分别对第一处理图像、多实例样本图像、第二处理图像和M个单实例样本图像进行特征提取,得到对应的图像特征,基于这些图像特征,进行模型训练,得到视觉感知模型。由于训练模型的图像特征不仅包括单实例样本图像的图像特征,还包括多实例样本图像的图像特征,因此,可以提高模型的泛化能力。
-
公开(公告)号:CN114429602A
公开(公告)日:2022-05-03
申请号:CN202210006151.2
申请日:2022-01-04
Applicant: 北京三快在线科技有限公司
Abstract: 本申请实施例提供了语义分割方法、装置、电子设备及存储介质方法,该方法包括:提取视频的多帧中的每一帧的原始特征,多帧包括:当前帧、至少一个先前帧,先前帧位于当前帧之前;将每一帧的原始特征输入到语义分割模型中,得到当前帧的语义分割结果,语义分割模型被配置为:基于每一帧的原始特征,确定每一帧的用于对齐的特征;对于每一个先前帧,基于该先前帧的用于对齐的特征与当前帧的用于对齐的特征,对该先前帧的用于对齐的特征进行可变形卷积,得到该先前帧的对齐空间特征,基于当前帧的用于对齐的特征、每一先前帧的对齐空间特征,得到当前帧的对齐运动特征;基于该对齐运动特征,预测当前帧的语义分割结果。
-
公开(公告)号:CN111400533A
公开(公告)日:2020-07-10
申请号:CN202010136046.1
申请日:2020-03-02
Applicant: 北京三快在线科技有限公司
IPC: G06F16/583 , G06K9/00 , G06N3/04
Abstract: 本申请公开了图像筛选方法、装置、电子设备和存储介质。所述方法包括:获取待筛选的多帧图像,其中,各帧图像分别带有对象标注信息和帧序;根据所述对象标注信息和帧序,确定目标对象的关联图像序列;对所述关联图像序列进行对象类别识别,得到所述关联图像序列的待校验类别;在所述待校验类别与所述目标对象匹配的情况下,根据所述关联图像序列筛选出包含所述目标对象的最优图像。有益效果在于,仅依赖图像的标注信息和帧序就可以完成图像的去重,可以应用于地图制作领域对地图外业采集数据的筛选,准确聚合同一路段的重复信息,区别于传统方案,不再依赖于GPS等位置信息对图像进行筛选,摆脱了GPS的位置偏差较大的问题。
-
公开(公告)号:CN110414572A
公开(公告)日:2019-11-05
申请号:CN201910612161.9
申请日:2019-07-08
Applicant: 北京三快在线科技有限公司
IPC: G06K9/62
Abstract: 本申请公开了一种图像识别的方法及装置,在该方法中将待识别图像输入到预设的图像识别模型中,得到该待识别图像属于各预设类别的概率,针对每个预设类别,可以根据预选确定出的该图像识别模型识别该预设类别的图像的准确率,计算该待识别图像属于该预设类别的补偿概率,根据该待识别图像属于各预设类别的补偿概率,对该待识别图像进行识别。由于可以通过预先确定出的该图像识别模型识别各预设类别的图像的准确率,对该待识别图像属于各预设类别的概率进行补偿,因此,降低了该待识别图像不属于的预设类别在该待识别图像的图像识别过程中所产生的影响,从而提高了图像识别的准确率。
-
公开(公告)号:CN110222569A
公开(公告)日:2019-09-10
申请号:CN201910368598.2
申请日:2019-05-05
Applicant: 北京三快在线科技有限公司
Abstract: 本公开公开了一种对象检测方法,包括:通过预设的外观形状检测模型,检测目标图片中所包含的与预设的外观形状类型匹配的检测对象;根据所述检测对象的位置信息,提取所述检测对象的特征信息;根据所述特征信息,以及预设的特征数据库,确定所述检测对象的所属类别。解决了现有的对象检测方案在每添加一个新品类时,都需要采集新品类的样本重新训练模型,扩展性较差,训练成本较高的技术问题。取得了提高模型适应性以及扩展性,降低检测成本的有益效果。
-
-
-
-
-
-
-
-
-