一种模型训练的方法、图像检测的方法及装置

    公开(公告)号:CN113887608B

    公开(公告)日:2023-03-24

    申请号:CN202111143124.1

    申请日:2021-09-28

    Abstract: 本说明书公开了一种模型训练的方法、图像检测的方法及装置,首先,获取样本图像。其次,将样本图像输入到待训练的预测模型,确定样本图像中涉及指定目标物的至少一个候选图像区域以及原始特征。而后,筛选出包含其他目标物的待处理区域,并根据其他目标物的图像在待处理区域中的位置,得到待处理区域对应的补偿特征。最后,根据待处理区域对应的补偿特征以及其他候选图像区域对应的原始特征,得到目标物检测结果,并以最小化目标物检测结果与样本图像中针对指定目标物的标签信息之间的偏差为优化目标,对预测模型进行训练。本方法可以在确定指定目标物所在区域时,避免将其他目标物所在区域检测为指定目标物区域,提高了预测模型的识别准确率。

    基于注意力模型的图像分割方法及装置

    公开(公告)号:CN114494291A

    公开(公告)日:2022-05-13

    申请号:CN202210049286.7

    申请日:2022-01-17

    Abstract: 本发明公开了一种基于注意力模型的图像分割方法及装置。其中,该方法包括:将目标图像的图像块输入至预先训练完成的图像分割模型中,其中,图像块是按照预设规则对目标图像分割得到的,图像分割模型包括编码器以及解码器;通过编码器中的多层子编码器,根据图像块的图像特征确定多层子编码器对应的多个图像向量表示,子编码器包括注意力编码器;通过图像分割模型中的解码器,根据多个图像向量表示确定图像块对应的图像预测结果。本发明解决了由于相关技术中编码器在全局特征提取方面存在不足,而导致解码器构造复杂,训练以及预测过程中计算量大的技术问题。

    目标对象的预测方法、装置、电子设备和存储介质

    公开(公告)号:CN114419390A

    公开(公告)日:2022-04-29

    申请号:CN202111604280.3

    申请日:2021-12-24

    Abstract: 本发明实施例提供了一种目标对象的预测方法和装置,其中,所述方法包括:将原始图像输入至第一检测模型,输出目标对象的第一位置信息和粗略类别信息;对原始图像进行裁剪得到多个目标对象区域图像,将多个目标对象区域图像输入至第二检测模型,输出每个目标对象的多个第二位置信息和多个精细类别信息;若存在目标类别对象则选择出目标预测对象;根据第一位置信息和第二位置信息生成位置预测结果,将精细类别信息作为类别预测结果。本发明实施例增加了目标对象的上下文信息,从而提高从第二检测模型输出的精细类别信息的准确率。针对目标类别对象选择出目标预测对象,避免了非目标预测对象的干扰,进一步提升目标对象预测的准确率。

    获取地图建图数据的方法、装置、设备及可读存储介质

    公开(公告)号:CN113920222B

    公开(公告)日:2025-03-25

    申请号:CN202111069336.X

    申请日:2021-09-13

    Abstract: 本申请公开了获取地图建图数据的方法、装置、设备及可读存储介质,属于图像处理技术领域。所述方法包括:基于第一图像数据的第一标签获取符合任务需求的第二标签;基于第二标签生成与第一图像数据匹配的第二图像数据;基于第二图像数据训练得到第一神经网络模型;通过第一神经网络模型对第三图像数据进行风格迁移,得到地图建图数据。本申请即使在第一图像数据缺少的情况下,也仍然能够利用生成的第二图像数据进行模型训练,提高了训练得到的神经网络模型的性能,因此,基于该第一神经网络模型对第三图像数据进行风格迁移时,得到的地图建图数据的图像质量更高,且提高了准确率。

    语义分割方法、装置、电子设备及存储介质

    公开(公告)号:CN114429602B

    公开(公告)日:2025-03-18

    申请号:CN202210006151.2

    申请日:2022-01-04

    Abstract: 本申请实施例提供了语义分割方法、装置、电子设备及存储介质方法,该方法包括:提取视频的多帧中的每一帧的原始特征,多帧包括:当前帧、至少一个先前帧,先前帧位于当前帧之前;将每一帧的原始特征输入到语义分割模型中,得到当前帧的语义分割结果,语义分割模型被配置为:基于每一帧的原始特征,确定每一帧的用于对齐的特征;对于每一个先前帧,基于该先前帧的用于对齐的特征与当前帧的用于对齐的特征,对该先前帧的用于对齐的特征进行可变形卷积,得到该先前帧的对齐空间特征,基于当前帧的用于对齐的特征、每一先前帧的对齐空间特征,得到当前帧的对齐运动特征;基于该对齐运动特征,预测当前帧的语义分割结果。

    图像识别模型训练方法及装置

    公开(公告)号:CN112699893A

    公开(公告)日:2021-04-23

    申请号:CN202110033686.4

    申请日:2021-01-11

    Abstract: 本公开提供了一种图像识别模型训练方法及装置。所述方法包括:将样本数据输入至预训练的图像识别模型;调用深层特征处理层对所述图像进行处理,得到图像对应的深层特征信息;调用细节特征引导层根据图像真值对图像进行处理,得到图像对应的细节特征值,并根据细节特征值确定细节特征引导层对应的细节损失值;在细节损失值处于第一预设范围内的情况下,将深层特征信息和细节特征值进行融合处理,得到图像对应的预测分类结果;根据初始分类结果和预测分类结果,计算得到图像识别模型的损失值;在损失值处于第二预设范围内的情况下,将训练后的图像识别模型作为目标图像识别模型。本公开可以使得网络能够更充分的编码空间信息,在提升语义分割性能的同时,不会引入额外的计算量消耗,更不会影响模型的推理速度。

    图像识别模型训练方法及装置

    公开(公告)号:CN112699893B

    公开(公告)日:2025-03-21

    申请号:CN202110033686.4

    申请日:2021-01-11

    Abstract: 本公开提供了一种图像识别模型训练方法及装置。所述方法包括:将样本数据输入至预训练的图像识别模型;调用深层特征处理层对所述图像进行处理,得到图像对应的深层特征信息;调用细节特征引导层根据图像真值对图像进行处理,得到图像对应的细节特征值,并根据细节特征值确定细节特征引导层对应的细节损失值;在细节损失值处于第一预设范围内的情况下,将深层特征信息和细节特征值进行融合处理,得到图像对应的预测分类结果;根据初始分类结果和预测分类结果,计算得到图像识别模型的损失值;在损失值处于第二预设范围内的情况下,将训练后的图像识别模型作为目标图像识别模型。本公开可以使得网络能够更充分的编码空间信息,在提升语义分割性能的同时,不会引入额外的计算量消耗,更不会影响模型的推理速度。

    获取地图建图数据的方法、装置、设备及可读存储介质

    公开(公告)号:CN113920222A

    公开(公告)日:2022-01-11

    申请号:CN202111069336.X

    申请日:2021-09-13

    Abstract: 本申请公开了获取地图建图数据的方法、装置、设备及可读存储介质,属于图像处理技术领域。所述方法包括:基于第一图像数据的第一标签获取符合任务需求的第二标签;基于第二标签生成与第一图像数据匹配的第二图像数据;基于第二图像数据训练得到第一神经网络模型;通过第一神经网络模型对第三图像数据进行风格迁移,得到地图建图数据。本申请即使在第一图像数据缺少的情况下,也仍然能够利用生成的第二图像数据进行模型训练,提高了训练得到的神经网络模型的性能,因此,基于该第一神经网络模型对第三图像数据进行风格迁移时,得到的地图建图数据的图像质量更高,且提高了准确率。

    一种模型训练的方法、图像检测的方法及装置

    公开(公告)号:CN113887608A

    公开(公告)日:2022-01-04

    申请号:CN202111143124.1

    申请日:2021-09-28

    Abstract: 本说明书公开了一种模型训练的方法、图像检测的方法及装置,首先,获取样本图像。其次,将样本图像输入到待训练的预测模型,确定样本图像中涉及指定目标物的至少一个候选图像区域以及原始特征。而后,筛选出包含其他目标物的待处理区域,并根据其他目标物的图像在待处理区域中的位置,得到待处理区域对应的补偿特征。最后,根据待处理区域对应的补偿特征以及其他候选图像区域对应的原始特征,得到目标物检测结果,并以最小化目标检测结果与样本图像中针对指定目标物的标签信息之间的偏差为优化目标,对预测模型进行训练。本方法可以在确定指定目标物所在区域时,避免将其他目标物所在区域检测为指定目标物区域,提高了预测模型的识别准确率。

    图像语义分割方法及装置
    10.
    发明公开

    公开(公告)号:CN112686267A

    公开(公告)日:2021-04-20

    申请号:CN202110033687.9

    申请日:2021-01-11

    Abstract: 本公开提供了一种图像语义分割方法及装置。包括:将待处理图像输入至图像识别模型;图像识别模型包括:短时密集连接网络层和解码网络层,短时密集连接网络层包括:卷积模块、多个短时密集连接层和输出模块,短时密集连接层包含多个短时密集连接模块;调用卷积模块对待处理图像进行处理得到待处理图像对应的第一特征图;调用短时密集连接层对第一特征图进行处理得到第二特征图;调用输出模块对第二特征图进行处理得到第三特征图;调用解码网络层对第三特征图进行上采样并向分割类别映射,得到通道数为分割类别数的第四特征图;根据第四特征图确定待处理图像对应的语义分割结果。本公开可以减少网络结构性冗余,提高图像语义分割性能和效率。

Patent Agency Ranking