基于提示学习的弱监督语义分割方法与装置

    公开(公告)号:CN116091774A

    公开(公告)日:2023-05-09

    申请号:CN202310171401.2

    申请日:2023-02-16

    Abstract: 本发明公开了一种基于提示学习的弱监督语义分割方法,包括:把图像和通过可学习的提示适配器的类别文本进行编码生成特征嵌入embeddings,然后将两者进行查询query,从而使图像以及其图像级别对应的类别标签作为训练数据;使用注意力进行查询,利用上一步生成的query和图像embeddings结果,添加一个transformer来在图像embeddings和query之间做一个自注意力;在训练过程中计算损失函数进行更新权重,将弱监督语义分割WSSS损失分为两部分:第一部分是seedingloss,第二部分是边界损失。本发明提出的WeakCLIP方法非常简单且高效。本发明还提供了相应的基于提示学习的弱监督语义分割装置。

    引入早期检测器的Transformer目标检测方法与装置

    公开(公告)号:CN115830300A

    公开(公告)日:2023-03-21

    申请号:CN202211481710.1

    申请日:2022-11-24

    Abstract: 本发明公开了一种引入早期检测器的Transformer目标检测方法,包括:将图像输入到视觉Transformer,提取出语义丰富的特征图;在该特征图上使用早期检测器,输出粗略的估计目标;取出置信度前N个估计目标,将该目标的检测框的四个坐标作为检测Transformer中解码器的参考点,并将预测出这些选定的估计目标的特征图上的特征点选定作为检测Transformer中解码器的目标标识符;所述N为预设值;检测Transformer的解码器利用步骤三提供的参考点和目标标识符,利用交叉注意力机制与步骤一提取出的特征图进行交互,从而不断精炼目标标识符和参考点的坐标,最终输出准确的目标检测框和目标类别。本发明还提供了相应的引入早期检测器的Transformer目标检测装置。

    基于双目视觉和深度学习的车辆避障方法与电子设备

    公开(公告)号:CN113255520A

    公开(公告)日:2021-08-13

    申请号:CN202110568966.5

    申请日:2021-05-25

    Abstract: 本发明公开了一种基于双目视觉和深度学习的车辆避障方法:获得车辆前方的RGB图;获取车辆前方的深度信息图;预测得到可行驶区域分割结果;信息融合优化可行驶区域;摒除可行驶区域部分的深度信息,生成深度障碍主视图;获取车前三维空间中的障碍分布情况,并依此得到鸟瞰障碍散点图;对鸟瞰障碍散点图进行密度聚类,去除噪声;对鸟瞰障碍散点图进行欧氏距离变换并设置自适应阈值,将前方地图分为安全行驶区域和危险区域;通过鸟瞰安全行驶区域图和视场角边界信息构建用于路径规划的地图;使用动态窗口法结合用于路径规划的地图进行避障路径规划;根据避障路径轨迹计算期望速度与期望打角并下发控制系统。本发明还提供了相应的电子设备。

    对象检测模型训练方法、目标对象检测方法

    公开(公告)号:CN109697460B

    公开(公告)日:2021-06-29

    申请号:CN201811479732.8

    申请日:2018-12-05

    Abstract: 本申请涉及一种目标对象检测方法、装置、计算机可读存储介质和计算机设备,该方法包括:获取待检测图像;将待检测图像输入至目标对象检测模型,目标对象检测模型是通过训练损失值对初始对象检测模型进行参数调整得到的,其中,训练损失值是根据第一区域和第二区域确定的目标像素点计算得到的,第一区域和所述第二区域是根据训练样本图像中目标类型对象的样本质心的位置确定得到的;目标对象检测模型生成待检测图像对应的预测图,预测图描述待检测图像的各个像素点属于目标检测对象的关系度;对预测图进行区域分割得到目标检测对象区域。此外,还提供了一种对象检测模型训练方法、装置、计算机可读存储介质和计算机设备。

    一种基于卷积神经网络的芯片缺陷识别方法

    公开(公告)号:CN107563999A

    公开(公告)日:2018-01-09

    申请号:CN201710789301.0

    申请日:2017-09-05

    Abstract: 本发明属于图像处理领域,并具体公开了一种基于卷积神经网络的芯片缺陷识别方法,其包括如下步骤:按预设的分类类别采集各类别芯片图像,并进行大小归一化处理以构建数据集;构建包括输入层、卷积层、降采集层、全连接层和输出层的卷积神经网络初始模型;从构建的数据集中随机提取图像以构建训练集,并将训练集中的图像输入构建的卷积神经网络初始模型中进行训练,获得卷积神经网络最终模型;采集待识别的芯片图像作为输入层直接输入卷积神经网络最终模型中,依次经过卷积层、降采集层和全连接层完成图像的特征提取,并由输出层输出识别结果,以此方式完成芯片缺陷的在线识别。本发明可实现芯片缺陷的快速识别,具有识别精度高、速度快的优点。

    基于仿生记忆链解决目标遮挡的端到端视频目标检测方法

    公开(公告)号:CN118918311A

    公开(公告)日:2024-11-08

    申请号:CN202410933365.3

    申请日:2024-07-12

    Abstract: 本发明涉及计算机视觉技术领域,提供了一种基于仿生记忆链解决目标遮挡的端到端视频目标检测方法。方法包括:对原始视频数据集中所有图像的感兴趣类别的目标进行实例级别的标注,得到带标注的标准训练数据集;定义基于仿生记忆链和遮挡目标实例监督的端到端视频目标检测算法模型;根据所述带标注的标准训练数据集,利用反向传播和梯度下降算法训练模型;利用训练好的模型对待检测视频进行视频目标检测。本发明更高效的融合包括当前帧与所有历史帧在内的时序特征,并且进行端到端的训练,训练速度较快,还可表征所有历史帧信息,并根据历史帧与当前帧的相关性和时间接近度来自适应地加权记忆,对被遮挡的目标具有强鲁棒性。

    基于门控线性注意力机制的图像分类识别方法与装置

    公开(公告)号:CN118397375A

    公开(公告)日:2024-07-26

    申请号:CN202410664140.2

    申请日:2024-05-27

    Abstract: 本发明公开了一种基于门控线性注意力机制的图像分类识别方法:(1)图像嵌入处理,包括以下子步骤:(1.1)将图像分块,铺平展开为图像序列;(1.2)将图像序列输入到图像序列嵌入层中去,处理得到图像特征序列;(2)将图像特征序列输入到由ViG基本处理单元堆叠构建成的图像基础处理网络得到新的图像特征序列;(3)将新的图像特征序列输入到池化层进行平均池化,将平均池化后的特征输入到线性层进行图片的类别预测。所提出的方法在分类数据集ImageNet及各种下游任务上表现出优越的精度、参数和FLOPs的权衡,显著优于当前流行的Transformer和CNN模型。本发明还提供了相应的于门控线性注意力机制的图像分类识别装置。

    基于朴素VisionTransformer的弱监督语义分割方法与装置

    公开(公告)号:CN116071553A

    公开(公告)日:2023-05-05

    申请号:CN202310160328.9

    申请日:2023-02-16

    Abstract: 本发明公开了一种基于朴素Vision Transformer的弱监督语义分割方法,包括:将基于输入图像得到的补丁标记和可学习的类标记输入到transformer编码器中得到特征输出;然后基于输出的补丁标记部分通过重排列和卷积操作得到粗糙CAM,并从编码器的模型参数中提取出自注意力图;接着通过自适应注意力图融合模块对自注意力图进行融合,得到交叉注意力图和补丁自注意力图依次对粗糙CAM进行优化得到最终的细CAM;最后分别基于编码器输出的类标记、粗CAM以及细CAM通过全局池化得到类别预测,与类别标记计算交叉熵损失函数来对网络进行优化;基于梯度截断解码器的在线再训练。本发明还提供了相应的基于朴素Vision Transformer的弱监督语义分割装置。

    基于双目视觉和深度学习的车辆避障方法与电子设备

    公开(公告)号:CN113255520B

    公开(公告)日:2022-04-12

    申请号:CN202110568966.5

    申请日:2021-05-25

    Abstract: 本发明公开了一种基于双目视觉和深度学习的车辆避障方法:获得车辆前方的RGB图;获取车辆前方的深度信息图;预测得到可行驶区域分割结果;信息融合优化可行驶区域;摒除可行驶区域部分的深度信息,生成深度障碍主视图;获取车前三维空间中的障碍分布情况,并依此得到鸟瞰障碍散点图;对鸟瞰障碍散点图进行密度聚类,去除噪声;对鸟瞰障碍散点图进行欧氏距离变换并设置自适应阈值,将前方地图分为安全行驶区域和危险区域;通过鸟瞰安全行驶区域图和视场角边界信息构建用于路径规划的地图;使用动态窗口法结合用于路径规划的地图进行避障路径规划;根据避障路径轨迹计算期望速度与期望打角并下发控制系统。本发明还提供了相应的电子设备。

Patent Agency Ranking