-
公开(公告)号:CN114359659A
公开(公告)日:2022-04-15
申请号:CN202111550104.6
申请日:2021-12-17
Applicant: 华南理工大学
IPC: G06V10/774 , G06V10/764 , G06V10/82 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开了基于注意力扰动的图像自动标注方法、系统和介质,方法包括下述步骤:将待标注数据集划分为有标签数据集和无标签数据集,对有标签数据集进行图像增强以扩充数据集,并使用对应标签进行标注;构建基于注意力扰动机制的生成对抗网络,所述生成对抗网络包括图像自编码器、生成器和判别器;使用待标注数据集迭代训练生成对抗网络,同时使用扩充后的有标签数据集优化判别器的多任务全连接分类网络;使用训练好的判别器对无标签的待标注图像进行分类标注。本方法构建基于注意力扰动机制的生成对抗网络,同时引入多任务全连接分类网络,通过对抗训练,优化了图像特征表示,实现了图像的自动标注,提升了图像生成的多样性和质量。
-
公开(公告)号:CN108765374A
公开(公告)日:2018-11-06
申请号:CN201810390350.1
申请日:2018-04-27
Applicant: 华南理工大学
CPC classification number: G06T7/0012 , G06T7/11 , G06T2207/20084 , G06T2207/30024 , G06T2207/30096
Abstract: 本发明提供了一种检测宫颈涂片图像中异常核区域的方法,包括下述步骤:(1)采用残差卷积神经网络提取图像特征图;(2)采用区域建议网络处理特征图输出建议目标区域以及分数;(3)提出几何特征保持的全卷积网络对特征图和建议目标区域进行位置回归以及分类;(4)提出命中度的概念,并以此作为核区域筛查和评估的方法。本发明对细胞图像进行有针对性的特征提取,使得既能提取高层语义信息,又能较好保持底层的细节特征,提升了分类结果;本发明从异常筛查的基本目的出发,增加了关注度的考量,更加符合医学细胞检测的需要;同时多方面考量不同目标间的大小、染色深度、形状等特征,可以对异常细胞核进行更好的理解和学习。
-
公开(公告)号:CN108288035A
公开(公告)日:2018-07-17
申请号:CN201810026945.9
申请日:2018-01-11
Applicant: 华南理工大学
Abstract: 本发明公开了一种基于深度学习的多通道图像特征融合的人体动作识别方法,包括:(1)从视频中提取原始RGB图片,并通过RGB图片计算分段视频的动态图、光流图;(2)对输入图片进行裁剪操作扩增训练数据集;(3)构建三通道卷积神经网络,将最后得到的视频片段分别输入三通道卷积神经网络中进行训练,得到对应的网络模型;(4)对待识别的视频片段,提取原始RGB图片、并计算其对应的动态图、光流图,并得到最终动作类别的识别结果。本发明利用三通道卷积神经网络对不同形态的原始输入学习数据的本质特征,并在网络中部对三种形态的数据进行多通道稠密融合操作,提高特征的表达能力和达到多通道信息共享,准确度高的目的。
-
公开(公告)号:CN107767416A
公开(公告)日:2018-03-06
申请号:CN201710791630.9
申请日:2017-09-05
Applicant: 华南理工大学
Abstract: 本发明提供了一种低分辨率图像中行人朝向的识别方法,包括下述步骤:(1)制作行人朝向数据集和标签,生成行人头部、腿部、全身三种训练样本;(2)对图像进行镜像处理和多尺度采样操作扩增训练数据集;(3)利用框架caffe进行训练,得到对应的神经网络模型;(4)利用(3)训练好的神经网络模型分别提取行人图像三通道特征;(5)利用Softmax分类器进行分类,得到最终的朝向识别结果。本发明提供了一种生成行人朝向图像数据集的方法,采取的镜像处理和多尺度采样等操作可有效扩增小数据集,减轻过拟合现象;通过深度学习训练的识别行人朝向的卷积神经网络模型能够提取更具区分度的特征,对行人图像三通道特征的加权使得朝向分类结果更加准确合理。
-
公开(公告)号:CN107301380A
公开(公告)日:2017-10-27
申请号:CN201710403300.8
申请日:2017-06-01
Applicant: 华南理工大学
Abstract: 本发明公开了一种用于视频监控场景中行人重识别的方法,通过如下步骤实现:S1、预训练FT-FNN网络;S2、微调FT-FNN网络;S3、提取训练图像深度特征和属性特征;S4、优化属性权重、S5、提取待识别图像属性特征;S6、提取行人库属性特征;S7、生成距离矩阵;S8、按序输出匹配图像。经过行人属性识别微调后的深度特征对行人重识别具有较强的区分能力;中层语义属性较低层纹理、颜色等视觉特征稳定,不易因光照、姿势的变化而产生较大变动;手动低层视觉特征的融入,能一定程度改善深度特征的区分能力,同时提高部分与颜色纹理紧密相关的中层属性的准确率。本发明结合了上述三者,在行人重识别领域取得了较好的准确率。
-
公开(公告)号:CN107122713A
公开(公告)日:2017-09-01
申请号:CN201710187970.0
申请日:2017-03-27
Applicant: 华南理工大学
Abstract: 本发明公开了一种基于深度学习的似物性检测方法,包括先对输入图像进行超像素分割以及深度学习的特征图提取,然后结合特征图和标记矩阵获取所有超像素的特征,根据所提取的超像素的特征进行超像素的合并操作,判断是否需要继续下一轮合并;若需要合并,则将新的标记矩阵将更新后的标签矩阵重新与特征图相结合,提取新的超像素特征,继续新的一轮合并;若合并已经结束,则将所包含的超像素信息送入训练好的网络进行似物性评估;之后根据所得到的似物性分数进行排序,最后将排序的结果输出。
-
公开(公告)号:CN105488814A
公开(公告)日:2016-04-13
申请号:CN201510836815.8
申请日:2015-11-25
Applicant: 华南理工大学
IPC: G06T7/20
Abstract: 本发明公开了一种检测视频中摇动背景的方法,包括如下步骤:S1获得待检测视频序列;S2计算视频序列每帧图像中每个像素的局部更新计数;S3根据每个像素的局部更新计数,计算每个像素的摇动测度,进一步得到每帧图像的摇动测度矩阵;S4对摇动测度矩阵的所有元素聚类为2类,取较少元素的像素所在的一类记为S1;S5将S1中所有像素点标记为摇动背景。本发明通过识别摇动的背景,可以消除摇动背景对运动前景提取的影响,提高视频中运动前景算法的准确度。
-
公开(公告)号:CN103489187A
公开(公告)日:2014-01-01
申请号:CN201310436675.6
申请日:2013-09-23
Applicant: 华南理工大学
IPC: G06T7/00
Abstract: 本发明公开了一种基于质量检测的宫颈LCT图像中细胞核的分割方法,包括如下步骤:S1对宫颈LCT图像进行粗分割,将粗分割得到的结果存储到待检测对象集;S2采用对象过滤器对待检测对象集中的对象进行检测,最终得到细胞核;S3多次重复S2,直到待检测对象集为空。本发明引入了质量控制机制,能保证分割结果符合要求,在宫颈LCT图像中的细胞重叠、染色不均、有杂质的情况下,得到准确率高的分割结果。
-
公开(公告)号:CN2612516Y
公开(公告)日:2004-04-21
申请号:CN03224272.7
申请日:2003-03-17
Applicant: 华南理工大学
IPC: B25J7/00
Abstract: 本实用新型是一种管道微机器人单轮直接驱动装置,该装置由驱动器连接体、单传动轮、传动驱动轮、驱动轮、微电机和从动轮相互连接组成,其相互连接关系为,单传动轮与微电机轴固定连接,传动驱动轮与驱动轮固定连接在驱动轮传动轴上,从动轮固定在从动轮转轴上,微电机固定在驱动器连接体上,驱动轮传动轴和从动轮转轴分别与驱动器连接体两端的轴承孔连接,同时,单传动轮与传动驱动轮构成一个传动副。采用本实用新型驱动的工业或医用微机器人,通过有线或无线控制微电机,可以实现微机器人的自动操控,提高工作效率。本实用新型使得管道微机器人的微驱动器结构大大简化、尺寸大大减小,成本也大为降低。
-
-
-
-
-
-
-
-