-
公开(公告)号:CN120032111A
公开(公告)日:2025-05-23
申请号:CN202510132463.1
申请日:2025-02-06
Applicant: 华南理工大学
IPC: G06V10/25 , G06V10/764 , G06V10/82 , G06V10/44 , G06V10/26 , G06T7/194 , G06N3/0464 , G06N3/088 , G06V20/58
Abstract: 本发明涉及一种无监督域自适应的开放世界目标检测方法,方法包括:获取待检测图像,生成初步伪标签;根据初步伪标签确定源域目标域,并将源域和目标域输入至目标预测器中进行目标检测;所述目标预测器根据源域和目标域中标签进行自训练,以适应目标域的数据分布。本发明通过伪标签的生成来逐步引导目标域模型的训练,通过学习源域和目标域之间的域不变特征,在不依赖目标域真实标签的情况下逐步提高模型在目标域上的表现,进而降低模型对已知目标的偏向性,提升对未见目标的感知能力。
-
公开(公告)号:CN120032110A
公开(公告)日:2025-05-23
申请号:CN202510132418.6
申请日:2025-02-06
Applicant: 华南理工大学
IPC: G06V10/25 , G06V10/82 , G06V10/26 , G06T7/194 , G06V10/44 , G06V10/42 , G06V10/52 , G06V10/80 , G06V10/764 , G06V10/766 , G06V10/776 , G06N3/0464 , G06N3/0455 , G06N3/096
Abstract: 本发明涉及一种用于开放世界目标检测的前景与背景解耦建模方法。该方法通过提取输入图像特征图后进行编码重构;并根据逐层的重构误差和融合误差,构建特征矩阵;以及考虑分布特性,基于特征矩阵构建不同的概率模型,从而实现对前景和背景的解耦建模。进一步,本申请设计了无监督提案生成模块,用于借助视觉模型生成伪标签,并通过双重过滤机制有效减少噪声标签与真实标签之间的竞争。本申请首先通过多尺度特征的重构误差有效捕捉其分布差异,然后基于分布差异采用适宜的建模方式,可有效解决现有开放世界目标检测中标签偏差的问题。
-
公开(公告)号:CN114611605B
公开(公告)日:2025-01-10
申请号:CN202210242390.8
申请日:2022-03-11
Applicant: 华南理工大学
IPC: G06V10/764 , G06N3/0464 , G06N3/045 , G06N3/08 , G06V10/74 , G06V10/774 , G06V10/82
Abstract: 本发明公开了一种关系网络小样本图像分类方法、系统、装置及介质,其中方法包括:划分数据集,在每个训练批次中,将数据集划分为训练集和测试集,训练集的样本标注有样本标签;采用嵌入模块提取数据集中图像的图片特征表示;利用自注意力模块学习任务间的上下文信息,将任务无关的图片特征表示转化为任务相关的图片特征表示;根据任务相关的图片特征表示,以基于原学习的关系网络度量方式训练神经网络,采用训练后的神经网络进行图像分类。本发明通过注意力机制,将任务无关特征向量转化为任务相关的特征向量,具有考虑任务上下文信息、缩小类内距离的优点,更有利于进行后面的度量计算相似度得分,可广泛应用于计算机视觉领域。
-
公开(公告)号:CN109993173B
公开(公告)日:2023-07-21
申请号:CN201910243680.2
申请日:2019-03-28
Applicant: 华南理工大学
Abstract: 本发明属于深度学习和计算机视觉技术领域,涉及一种基于种子生长及边界约束的弱监督图像语义分割方法,包括:对待分割图像进行预处理,并通过弱定位的方法,提取待分割图像中目标物体的初始种子点;以初始种子点作为监督信息,采用分割网络对图像进行初分割,并引入线性约束指导种子点合理生长,得到生长后的目标物体;结合条件随机场和Roberts算子,对生长后的目标物体进行分割边缘优化,输出分割结果;构建及训练弱监督语义分割MSOSEC模型,对训练好的MSOSEC模型进行参数权重的评估,剪除权重较低的参数,得到优化后的MSOSEC模型;基于优化后的MSOSEC模型,进行弱监督图像语义分割。本发明方法提高了弱监督图像语义分割质量及效率。
-
公开(公告)号:CN116229154A
公开(公告)日:2023-06-06
申请号:CN202310043261.0
申请日:2023-01-29
Applicant: 华南理工大学
IPC: G06V10/764 , G06V10/44 , G06N20/00
Abstract: 本发明公开了一种基于动态混合模型的类增量图像分类方法,应用于数据分阶段到来的类增量学习场景,步骤如下:在初始时间阶段,利用初始训练数据集训练初始分类模型;在后续各时间阶段,构建并输入增量学习数据集以更新训练得到能够同时识别新旧类的新分类模型。在训练过程中,通过旧分类模型在新类上的表现动态选择训练方法;若可塑性较低则使用扩增方法增加模块以适应新数据提高其可塑性;若可塑性较高则利用局部特征信息代替全局特征信息以合理的调节蒸馏方法强度巩固其稳定性。本发明通过动态选择训练方法调节分类模型可塑性和稳定性,使分类模型在有限存储空间的情况下学习新知识且有效的保留旧知识,是一个高效且实用的类增量学习方法。
-
公开(公告)号:CN108830855B
公开(公告)日:2022-03-25
申请号:CN201810281580.4
申请日:2018-04-02
Applicant: 华南理工大学
IPC: G06T7/10 , G06V10/764 , G06V10/50 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于多尺度低层特征融合的全卷积网络语义分割方法,首先用全卷积神经网络对输入图像进行密集特征的提取;然后对提取的特征图像进行多尺度特征融合处理。其步骤包括对输入特征图进行多尺度池化,形成多条处理分支,然后对各分支中池化后尺度不变的特征图进行低层特征融合处理,对于池化后尺度缩小的特征图,则进行低层特征融合上采样处理,接着分别经过3×3卷积层以学习更深层次的特征及减少输出特征图的通道数,之后再把各分支的输出特征图以通道数拼接的方式结合在一起,并经过类别卷积层和双线性插值上采样处理后,得到跟原图像等尺寸的得分图。结合局部低层特征信息和全局多尺度图像信息,使图像语义分割的效果更为显著。
-
公开(公告)号:CN109993173A
公开(公告)日:2019-07-09
申请号:CN201910243680.2
申请日:2019-03-28
Applicant: 华南理工大学
Abstract: 本发明属于深度学习和计算机视觉技术领域,涉及一种基于种子生长及边界约束的弱监督图像语义分割方法,包括:对待分割图像进行预处理,并通过弱定位的方法,提取待分割图像中目标物体的初始种子点;以初始种子点作为监督信息,采用分割网络对图像进行初分割,并引入线性约束指导种子点合理生长,得到生长后的目标物体;结合条件随机场和Roberts算子,对生长后的目标物体进行分割边缘优化,输出分割结果;构建及训练弱监督语义分割MSOSEC模型,对训练好的MSOSEC模型进行参数权重的评估,剪除权重较低的参数,得到优化后的MSOSEC模型;基于优化后的MSOSEC模型,进行弱监督图像语义分割。本发明方法提高了弱监督图像语义分割质量及效率。
-
公开(公告)号:CN118349911A
公开(公告)日:2024-07-16
申请号:CN202410395476.3
申请日:2024-04-02
Applicant: 华南理工大学
IPC: G06F18/2431 , G06F18/23213 , G06N3/047 , G06N3/088 , G06N3/096
Abstract: 本发明公开了一种基于对比学习和自适应分类器的跨域新类发现方法。本发明构建了一种已知类‑新类映射协议和一个自适应分类器以及两个相关的损失函数。与现有方法相比,本发明能够在跨领域的情况下预测目标域中新类别的数量。并学习到各未知类更好的特征表示。广泛的实验结果表明,本发明在开放集域适应(ODA)和通用域适应(UNDA)场景下的图像分类问题上拥有优越的性能,并显著提升了通用域适应场景下发现新类发现的能力。
-
公开(公告)号:CN116863250B
公开(公告)日:2024-05-03
申请号:CN202311119364.7
申请日:2023-09-01
Applicant: 华南理工大学
IPC: G06V10/764 , G06N3/0464 , G06N3/08 , G06V10/762 , G06V10/82 , G06V20/50
Abstract: 本发明公开了一种涉及多模态未知类识别的开放场景目标检测方法。所述方法包括以下步骤:训练得到开放场景未知识别的目标检测模型UC‑OSOD;利用RPN产生背景框,将分值排前列的背景框标注为潜在未知类别;利用对比聚类的方法分离已知类别和未知类别;利用基于多模态的CLIP模型,优化开放场景未知识别的目标检测模型UC‑OSOD,识别未知类别并进行分类;根据提供的未知类标签,利用增量学习方法学习新类,进而循环实现开放场景未知类识别。本发明实现了开放场景下对未经训练的对象检测,并实现了对未知类别的Zero‑Shot预测,减少了人工标注的成本,提高了开放场景下目标检测精度。
-
公开(公告)号:CN116863250A
公开(公告)日:2023-10-10
申请号:CN202311119364.7
申请日:2023-09-01
Applicant: 华南理工大学
IPC: G06V10/764 , G06N3/0464 , G06N3/08 , G06V10/762 , G06V10/82 , G06V20/50
Abstract: 本发明公开了一种涉及多模态未知类识别的开放场景目标检测方法。所述方法包括以下步骤:训练得到开放场景未知识别的目标检测模型UC‑OSOD;利用RPN产生背景框,将分值排前列的背景框标注为潜在未知类别;利用对比聚类的方法分离已知类别和未知类别;利用基于多模态的CLIP模型,优化开放场景未知识别的目标检测模型UC‑OSOD,识别未知类别并进行分类;根据提供的未知类标签,利用增量学习方法学习新类,进而循环实现开放场景未知类识别。本发明实现了开放场景下对未经训练的对象检测,并实现了对未知类别的Zero‑Shot预测,减少了人工标注的成本,提高了开放场景下目标检测精度。
-
-
-
-
-
-
-
-
-