-
公开(公告)号:CN117496136A
公开(公告)日:2024-02-02
申请号:CN202311276925.4
申请日:2023-09-28
Applicant: 中国科学院香港创新研究院人工智能与机器人创新中心有限公司 , 中国科学院自动化研究所
IPC: G06V10/26 , G06V10/764 , G06V10/82 , G06V10/762 , G06V20/70 , G06N3/0464 , G06N3/0895
Abstract: 本申请提供一种弱监督语义分割方法、装置及存储介质,其中方法包括:基于图像分类标签将语义特征分为语义正特征和语义负特征,所述语义特征基于每一语义类别对应的训练好的第一CAM模型获取;将所述语义正特征转换为类别正模板,将所述语义负特征转换为类别负模板;将图像样本重新经过CAM网络获得预测的第二CAM模型,基于所述类别正模板和所述类别负模板,训练所述第二CAM模型直至达到预设的epoch次数,以用于语义分割。本申请实现了仅使用低成本的图像标注生成高质量的伪语义分割图用于训练语义分割模型,减少大量的人工标注成本。
-
公开(公告)号:CN116912488A
公开(公告)日:2023-10-20
申请号:CN202310706587.7
申请日:2023-06-14
Applicant: 中国科学院自动化研究所
Abstract: 本发明涉及计算机视觉技术领域,提供一种基于多目相机的三维全景分割方法及装置,该方法获取多目相机采集的多个当前帧图像;将多个当前帧图像输入至三维全景分割模型,由图像编码模块提取每个当前帧图像的多尺度图像特征,由视图编码模块基于相机投影关系,将每个当前帧图像的多尺度图像特征转换为三维体素特征,由时序编码模块将所述多目相机采集的历史帧图像的三维体素特征与当前帧图像的三维体素特征进行融合,得到时序融合结果,由体素上采样模块将时序融合结果进行上采样,得到上采样结果,由体素解码模块对上采样结果进行解码,得到并输出全景分割结果。该方法可以得到稠密的三维全景分割结果,实现精细的语义理解。
-
公开(公告)号:CN116486194A
公开(公告)日:2023-07-25
申请号:CN202310267421.X
申请日:2023-03-15
Applicant: 中国科学院自动化研究所
IPC: G06V10/774 , G06V10/25
Abstract: 本发明提供一种3D目标检测模型的训练方法及装置,涉及人工智能技术领域,其中所述3D目标检测模型的训练方法包括:获取点云数据集;将点云数据集输入至初始3D目标检测模型,得到与点云数据集对应的初始伪标签;将初始伪标签输入局部通路进行处理,得到与点云数据集对应的局部伪标签;将初始伪标签输入全局通路进行处理,得到与点云数据集对应的全局伪标签;将局部伪标签和全局伪标签进行合并处理,确定与点云数据集对应的目标伪标签;基于点云数据集和目标伪标签对初始3D目标检测模型进行训练,直至达到训练停止条件,得到训练好的3D目标检测模型。通过上述方法,提高了3D目标检测模型的检测精度。
-
公开(公告)号:CN114743041B
公开(公告)日:2023-01-03
申请号:CN202210225051.9
申请日:2022-03-09
Applicant: 中国科学院自动化研究所 , 华为云计算技术有限公司
IPC: G06V10/764 , G06V10/774 , G06V10/74 , G06V10/82 , G06N3/04 , G06N3/08
Abstract: 本发明提供了一种预训练模型抽选框架的构建方法及装置,该方法包括:选取图像数据集和自监督对比学习框架;根据图像数据集和自监督对比学习框架对构建的超网预训练模型进行训练,得到训练好的超网预训练模型;选取下游迁移任务和下游迁移数据集;在基于自监督对比学习框架获取的采样空间中筛选符合预设条件的第一模型,基于下游迁移任务和下游迁移数据集计算第一模型与训练好的超网预训练模型的相似度;基于相似度的计算结果,确定与训练好的超网预训练模型共享权重的目标预训练模型,得到预训练模型抽选框架。该方法可以实现高效的下游任务定制化抽取,抽取出的模型具有极佳的泛化能力。
-
公开(公告)号:CN113221903A
公开(公告)日:2021-08-06
申请号:CN202110511242.7
申请日:2021-05-11
Applicant: 中国科学院自动化研究所
Abstract: 本发明涉及一种跨域自适应语义分割方法及系统,所述方法包括获取不同域训练数据集;对训练数据集进行迭代训练,建立熵值预测模型:根据熵值预测模型,计算目标域数据的熵值;对各熵值进行多元高斯拟合,通过最大期望算法,得到两个峰值的高斯分布;根据所述高斯分布,确定伪标签;根据伪标签,重新训练目标域数据,构造语义分割模型;基于所述语义分割模型,对待处理数据进行语义分割。本发明通过对不同域训练数据集进行迭代训练,建立熵值预测模型,进而计算熵值,通过多元高斯拟合,最大期望算法,得到高斯分布,确定目标域数据的伪标签,排除手工阈值的干扰,以便于准确构造基于伪标签的语义分割模型,从而实现对待处理数据的自动语义分割。
-
公开(公告)号:CN111711868B
公开(公告)日:2021-07-20
申请号:CN202010595530.0
申请日:2020-06-24
Applicant: 中国科学院自动化研究所
Abstract: 本发明属于计算机视觉、视听任务领域,具体涉及一种基于视听多模态的舞蹈生成方法、系统、装置,旨在解决现有的舞蹈生成方法忽略了骨架信息关键点之间的连接关系,导致生成的舞蹈质量较差的问题。本系统方法包括:获取音频信息序列、2D舞蹈骨架信息,将2D舞蹈骨架信息作为第一信息;将第一信息转换为图像,并结合第一信息、音频信息序列中第t帧的音频信息,通过舞蹈生成模型生成新的2D舞蹈骨架信息,作为第二信息;判断t是否等于音频信息序列的长度,若否,令t=t+1,将第二信息作为第一信息,循环生成第二信息;否则以第一信息顺次转换的图像作为舞蹈片段输出。本发明提高了舞蹈生成的质量。
-
公开(公告)号:CN111723813B
公开(公告)日:2021-07-06
申请号:CN202010506805.9
申请日:2020-06-05
Applicant: 中国科学院自动化研究所
Abstract: 本发明属于深度学习、计算机视觉及模式识别领域,具体涉及了一种基于类内判别器的弱监督图像语义分割方法、系统、装置,旨在解决弱监督采用的粗略标注带来的语义分割不准确的问题。本发明包括:为每个图像级的类别构建两级类内判别器,用以判断所属该图像类别的各像素点属于目标前景或是背景,并使用弱监督的数据进行训练;基于该类内判别器生成像素级的图像类别标签,生成语义分割结果并输出;还可以使用该标签进行图像语义分割模块或网络的训练,得到最终用于无标签输入图像的语义分割的模型。本发明充分挖掘隐含在特征编码中的类内图像信息,准确区分前景与背景像素,在仅依赖图像级标注的情况下,显著地提高弱监督语义分割模型的性能。
-
公开(公告)号:CN112446905A
公开(公告)日:2021-03-05
申请号:CN202110126538.7
申请日:2021-01-29
Applicant: 中国科学院自动化研究所
Abstract: 本发明属于实时定位与建图、计算机视觉技术领域,具体涉及一种基于多自由度传感关联的三维实时全景监控方法、系统、装置,旨在解决现有监控技术无法实现大范围三维全景视频监控,监控效率低、效果差的问题。本系统方法包括获取N种不同自由度的传感器的实时观测数据,构建各传感器对应的三维语义地图,作为局部地图;对各传感器产生的局部地图进行整合,得到全景地图,作为第一地图;通过RANSAC算法获取各传感器在第一地图中对应估计的外参矩阵;计算真实的外参矩阵与估计的外参矩阵的误差,对第一地图进行更新,得到待监控场景当前时刻最终获取的全景地图。本发明实现大范围内三维全景视频监控,提高了监控效率,保证了监控的质量与效果。
-
公开(公告)号:CN111723813A
公开(公告)日:2020-09-29
申请号:CN202010506805.9
申请日:2020-06-05
Applicant: 中国科学院自动化研究所
Abstract: 本发明属于深度学习、计算机视觉及模式识别领域,具体涉及了一种基于类内判别器的弱监督图像语义分割方法、系统、装置,旨在解决弱监督采用的粗略标注带来的语义分割不准确的问题。本发明包括:为每个图像级的类别构建两级类内判别器,用以判断所属该图像类别的各像素点属于目标前景或是背景,并使用弱监督的数据进行训练;基于该类内判别器生成像素级的图像类别标签,生成语义分割结果并输出;还可以使用该标签进行图像语义分割模块或网络的训练,得到最终用于无标签输入图像的语义分割的模型。本发明充分挖掘隐含在特征编码中的类内图像信息,准确区分前景与背景像素,在仅依赖图像级标注的情况下,显著地提高弱监督语义分割模型的性能。
-
公开(公告)号:CN111126327A
公开(公告)日:2020-05-08
申请号:CN201911391910.6
申请日:2019-12-30
Applicant: 中国科学院自动化研究所
Abstract: 本发明涉及一种车道线检测方法、系统、车载系统及车辆,所述获取多幅原始图像及对应的标签;根据各原始图像及对应的标签,建立基于标签的特征提取网络;根据特征提取网络,提取各原始图像对应的回归特征图和前后背景分类的特征图;根据回归特征图和前后背景分类的特征图,得到车道线区域的偏差值;根据所述车道线区域的偏差值分离出各车道线;将分离后的各车道线进行拟合处理,得到拟合线;根据当前待检测图像,从各所述拟合线中选择出所述当前待检测图像对应的拟合线,得到检测结果。本发明在整个计算过程中不需要估计密度,从而可大大提高聚类的效率,降低计算量,提高计算机性能,同时提高车道线检测速度。
-
-
-
-
-
-
-
-
-