-
公开(公告)号:CN108764281A
公开(公告)日:2018-11-06
申请号:CN201810346336.1
申请日:2018-04-18
Applicant: 华南理工大学
CPC classification number: G06K9/6268 , G06K9/66 , G06N3/0454
Abstract: 本发明公开了一种基于半监督自步学习跨任务深度网络的图像分类方法,包括以下步骤:S1、从图像整体数据集中随机选取少量标注样本,保留其标签,剩下所有样本作为未标注样本,在整个流程中不知道其真实标签,标注样本的权重在训练过程中恒为1,未标注样本权重初始化为0,初始时只使用标注样本作为训练集;S2、使用训练集训练跨任务深度网络;S3、根据训练好的跨任务深度网络,预测所有未标注样本的伪标签,并赋予每个未标注样本相应权重;S4、根据自步学习范式,选取高置信度的未标注样本,添加到训练集中;S5、重复步骤S2‑S4,直到跨任务深度网络性能饱和或者达到预设循环次数。所述方法不需要输入人为设计的特征,直接输入原始图像即可实现分类。
-
公开(公告)号:CN120047454A
公开(公告)日:2025-05-27
申请号:CN202510105687.3
申请日:2025-01-23
Applicant: 华南理工大学
IPC: G06T7/10 , G06N3/045 , G06N3/0475 , G06N3/094 , G06N3/0464
Abstract: 本发明公开了一种基于生成对抗神经网络的可控行人生成方法、设备及介质,以判别器和生成器相互对抗的方式实现合成效果的提升;生成器整体为编码解码结构,并在解码器中引入了三分支结构:前景分支头合成行人特征图,背景分支头合成街景特征图,掩膜分支头合成行人的分割掩膜并以此指导前景分支与背景分支的特征图融合。判别器包括行人判别器和掩膜判别器,用于对抗训练提升生成器合成的行人、掩膜的真实程度,并且衡量掩膜是否能够准确分割出合成图像中的行人。模型另外通过损失函数约束输入的掩膜与合成的掩膜一致,从而实现依照指定的语义掩膜控制行人图像的合成。本发明可广泛应用于行人生成的技术领域。
-
公开(公告)号:CN114913057B
公开(公告)日:2024-07-02
申请号:CN202210535719.X
申请日:2022-05-17
Applicant: 华南理工大学
IPC: G06T3/04 , G06N3/0475 , G06N3/045 , G06N3/0464 , G06N3/0455 , G06N3/094 , G06T5/40 , G06V10/26 , G06V10/774 , G06V40/16 , G06V10/82
Abstract: 本发明公开了一种基于生成对抗学习的人脸妆容迁移方法,包括:S1、准备三个不同的数据集;S2、将原始图像的风格转换成处理图像的风格;S3、使用预训练的人脸分割模型对图像中的人脸进行区域划分;S4、将上妆后的图像中的妆容迁移到未上妆的处理图像,完成人脸妆容迁移的任务。本发明使用易于收集的质量较低的人脸图像作为原始数据,结合图像增强模型(即神经网络),训练一个用于人脸妆容迁移的模型(即神经网络),以提升人脸妆容迁移的适用性。
-
公开(公告)号:CN115565223A
公开(公告)日:2023-01-03
申请号:CN202211181562.1
申请日:2022-09-27
Applicant: 华南理工大学
IPC: G06V40/16 , G06N3/04 , G06N3/08 , G06V10/764
Abstract: 本发明公开了一种基于图卷积网络的生成对抗网络的人脸图像编辑方法,该方法使用一个生成器来对人脸图像进行编辑,为了训练该生成器,需使用一个辨别器与其进行对抗训练,考虑到人脸图像编辑中各个属性之间存在相关性,使用图卷积网络来利用属性之间的关联信息,增强辨别器对于多属性编辑情况下的辨别能力,进而提升生成器的图像编辑能力。本发明在辨别器上采用了图卷积层并结合数据集中人脸属性之间的关联信息来提升辨别器对于多属性编辑情况下的辨别能力。本发明针对人脸图片中属性之间的联系利用图卷积网络来进行建模,提升了辨别器在多属性条件下区分真假样本的能力,使得生成器可以更好地进行多属性条件下的人脸编辑任务。
-
公开(公告)号:CN114359956A
公开(公告)日:2022-04-15
申请号:CN202111499395.0
申请日:2021-12-09
Applicant: 华南理工大学
IPC: G06V40/10 , G06V10/764 , G06V10/774 , G06V10/82 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于图像转换的半监督行人检测方法,首先在目标场景用少量的标注数据训练一个初始检测器,对目标场景和外部场景的无标注数据作预测,作为伪标注,截取出行人图像。然后用目标场景和外部场景的行人图像训练一个用于图像转换的神经网络,行人的风格和内容被解耦,在保持行人内容一致性的同时,可将外部场景的行人图像转换成目标场景的风格。转换后的行人图像被用于训练一个分类器,进一步筛选出半监督行人检测中的伪标注,得到更高质量的伪标注。伪标注与少量的标注数据一起作为训练数据,训练一个新的行人检测的检测器,提升行人检测的性能,完成行人检测的任务,最终得到更好的行人检测效果。
-
公开(公告)号:CN113011487A
公开(公告)日:2021-06-22
申请号:CN202110279401.5
申请日:2021-03-16
Applicant: 华南理工大学
Abstract: 本发明公开了一种基于联合学习与知识迁移的开放集图像分类方法,该方法提出了一个包含域对抗网络和特有网络的深度神经网络模型,用于解决开放集图像分类问题。其中域对抗网络同时对源域数据和目标域数据进行学习,从而其学习到的特征表达在两个域上都具有一定的泛化性能。特有网络则专注于目标域数据的学习,其特征对目标域数据有更强的针对性。在两个网络联合学习和知识交换的过程中,特有网络学习到的特征能利用到域对抗网络所提供的指导,间接利用到了源域数据的监督信息,同时又减少了源域数据对其学习目标域数据带来的干扰,从而模型能够达到比较好的性能。
-
公开(公告)号:CN112381148A
公开(公告)日:2021-02-19
申请号:CN202011282976.4
申请日:2020-11-17
Applicant: 华南理工大学
Abstract: 本发明公开了一种基于随机区域插值的半监督图像分类方法,该方法从训练集中选取少量有真实标签的图像,剩下其它图像作为无真实标签图像;两类图像同时送入到随机区域插值模块;插值的过程会有所不同,带有真实标签图像可以直接通过插值生成新的增广图像,但是无真实标签图像无法正常插值,所以会先通过教师网络获得高置信度的标签信息作为无真实标签图像的临时标签,然后再进行插值操作;用新的增广图像对网络进行训练,直到网络模型训练到预先设定的次数。本发明方法是同时对两类图像进行随机区域插值,生成新的增广图像用于训练分类网络,提高了训练模型的泛化性能。
-
公开(公告)号:CN110084131A
公开(公告)日:2019-08-02
申请号:CN201910264411.4
申请日:2019-04-03
Applicant: 华南理工大学
Abstract: 本发明公开了一种基于深度卷积网络的半监督行人检测方法,包括,从公共数据集的100%完整的训练集中随机抽取5%作为半监督学习的训练集,保留其标注,作为有标注训练集,其余的95%作为未标注的训练集,删除其标注;采用改进后的RPN卷积神经网络,加入一致性约束正则项来提高网络的特征表达能力,从而提升模型的鲁棒性,另一方面通过自步学习,减小深度学习网络的对大量人工标注样本的依赖性,降低在小样本的条件下深度学习网络的过拟合风险。
-
公开(公告)号:CN106408562A
公开(公告)日:2017-02-15
申请号:CN201610844032.9
申请日:2016-09-22
Applicant: 华南理工大学
CPC classification number: G06T7/0012 , G06T2207/20032 , G06T2207/20081 , G06T2207/30101
Abstract: 本发明公开了一种基于深度学习的眼底图像视网膜血管分割方法及系统,包括:对训练集进行数据扩增,并对图像进行增强,用训练集训练卷积神经网络,先使用卷积神经网络分割模型对图像进行分割得到一个分割结果,用卷积神经网络的特征训练随机森林分类器,从卷积神经网络模型中抽取最后一层卷积层输出,并作为随机森林分类器的输入进行像素分类,得到另外一个分割结果,对两个分割结果进行融合得到最终的分割图像,与传统的血管分割方法相比,本方法用很深的卷积神经网络进行特征提取,提取的特征更加充分,分割的准确率和效率也更高。
-
公开(公告)号:CN106897738B
公开(公告)日:2019-07-16
申请号:CN201710052773.8
申请日:2017-01-22
Applicant: 华南理工大学
Abstract: 本发明公开了一种基于半监督学习的行人检测方法,首先获取源图像集的训练样本和所属类别,将目标场景图像集中的一部分图像进行行人标记,获取目标场景图像对应的训练样本和样本特征;其次由源图像集的训练样本训练生成决策森林,目标场景图像集中知晓所属类别的训练样本对决策森林中的决策树进行筛选,重组后产生新的决策森林;再者通过新的决策森林对目标场景图像集中未知所属类别训练样本进行评分,将置信度高的训练样本标记为行人训练样本;然后通过目标场景图像集中知晓输送类别的训练样本以及上述行人训练样本训练神经网络;最后测试样本输入至新的决策森林,将置信度高的测试样本通过神经网络得出行人检测结果。具有行人检测精度高的优点。
-
-
-
-
-
-
-
-
-