-
公开(公告)号:CN113724339A
公开(公告)日:2021-11-30
申请号:CN202110503629.8
申请日:2021-05-10
Applicant: 华南理工大学
Abstract: 本发明属于图像处理及机器学习技术领域,涉及一种基于颜色空间特征的少样本瓷砖分色方法。该方法包括:在预设环境下,采集第一瓷砖图像;利用角点检测、仿射变换、图像分割一系列图像处理技术将第一瓷砖图像的瓷砖区域与背景分离,并将分离后的纯净瓷砖区域从RGB色彩空间转换到HSV色彩空间;将HSV纯净瓷砖区域切分成细胞单元,基于HSV色彩空间提取出瓷砖色彩特征,并通过特征选择得到瓷砖的有效色彩特征;根据采集到的带标签的第一瓷砖图像的有效色彩特征及对应标签构建数据集,完成瓷砖分色器训练;基于瓷砖分色器对第二瓷砖图像进行色差分色。本发明解决了人工瓷砖分色难度高、耗时耗力,深度学习模型训练需要大量数据的问题。
-
公开(公告)号:CN109683719B
公开(公告)日:2021-10-22
申请号:CN201910090253.5
申请日:2019-01-30
Applicant: 华南理工大学
Abstract: 本发明公开了一种基于YOLOv3的视觉投影交互方法,系统硬件包括PC、摄像头、近红外激光、近红外滤光片和投影仪,本发明的交互场景是弓箭射击虚拟交互场景,核心目标是获取弓箭的离弦速度和弓箭的击中位置,包括步骤,首先系统利用近红外激光构建一个近红外光面,当弓箭触及该光面时将产生高亮光斑,之后通过二值化、膨胀、腐蚀等图像处理算法来实现对射击位置的检测;其次,利用YOLOv3神经网络算法实现对双手位置的检测,进而确定双手距离;最后通过双手距离与弓箭离弦速度的线性关系获得弓箭的离弦速度。本发明使用YOLOv3神经网络模型进行双手位置的检测,相对于传统的手势追踪,本发明在准确度和速度方面拥有明显的优势。
-
公开(公告)号:CN113516429A
公开(公告)日:2021-10-19
申请号:CN202110379885.0
申请日:2021-04-08
Applicant: 华南理工大学
Abstract: 本发明公开了一种基于网络拥堵模型的多AGV全局规划方法,首先建立区域化的地图,并根据运输需求给AGV分配任务,确定AGV路径的起始区域和目标区域;然后,在距离代价的基础上,引入包含转弯代价的时间代价与基于修正网络拥塞扩散模型的区域密度估值,以更新A*算法的估计代价值;最后基于改进A*算法进行区域间全局路径规划,获取连接当前区域和目标区域的路径区域集。本发明根据区域拥堵情况这一指标对传统的A*算法进行改进。本发明利用网络拥塞模型预测各个区域的拥堵情况,在调度时尽可能使AGV合理分布在各个区域内,提高了多AGV系统的运输效率的同时降低了调度算法的复杂度。
-
公开(公告)号:CN111290582B
公开(公告)日:2021-09-21
申请号:CN202010134990.3
申请日:2020-02-29
Applicant: 华南理工大学
IPC: G06F3/01
Abstract: 本发明公开了一种基于改进型直线检测的投影交互区域定位方法,包括以下步骤:S1、图像采集,对图像进行灰度化处理,按不同权重对RGB三分量进行加权平均得到灰度图像;S2、利用高核拉普拉斯滤波对灰度化图像后进行卷积操作;S3、基于直方图的二值化,采用滑窗法,利用窗体内的直方图特征对每个像素进行去噪筛选;S4、使用霍夫直线检测算法对去噪后图像检测,并利用投影区域的特点筛选出四条边界线,由得到的四条边界线,实现投影区域定位。
-
公开(公告)号:CN113112819A
公开(公告)日:2021-07-13
申请号:CN202110325403.3
申请日:2021-03-26
Applicant: 华南理工大学
Abstract: 本发明属于交通速度预测技术领域,涉及一种基于改进LSTM的图卷积交通速度预测方法,包括:对交通速度数据进行预处理,构建城市路网的拓扑结构图和构建交通速度预测模型的输入;构建基于改进LSTM的图卷积网络交通速度预测模型,交通速度预测模型使用图卷积模块获取交通速度的空间相关性,使用改进LSTM模块捕获由特征矩阵序列表示的片段序列中交通速度的时间相关性;对交通速度预测模型进行训练,并评估交通速度预测模型;基于训练好的交通速度预测模型进行交通速度预测。本发明使用改进的LSTM模型能避免模型训练时出现梯度消失和梯度爆炸问题,更好地获取交通数据的时间相关性。本发明具有预测速度快、预测精度高等优点。
-
公开(公告)号:CN112861602A
公开(公告)日:2021-05-28
申请号:CN202011435882.6
申请日:2020-12-10
Applicant: 华南理工大学
Abstract: 本发明涉及一种基于深度可分离卷积的人脸活体识别模型压缩和移植方法,包括如下步骤:S1、通过数据增强的方式获得一个训练数据集;S2、利用改进的卷积神经网络对图像进行训练,并保存训练后得到的卷积神经网络模型;S3、基于深度可分离卷积对模型进行压缩,削减模型大小,使得模型参数削减为原始模型的20%左右,使得其尺寸更适合于移动端。S4、通过对模型权重进行半精度Float16量化进一步地压缩模型,加快模型推理速度,使得模型大小压缩为S3步骤的50%,移动端识别速度缩短为400ms,完成模型在移动端软件的移植。本发明基于深度可分离卷积对模型进行压缩且Float16半精度量化。
-
公开(公告)号:CN112766137A
公开(公告)日:2021-05-07
申请号:CN202110049881.6
申请日:2021-01-14
Applicant: 华南理工大学
Abstract: 本发明公开了一种基于深度学习的动态场景异物入侵检测方法,该方法包括先利用监控设备采集所监控场景的RGB图像帧;然后利用训练好的目标分割模型对图像中的目标区域进行分割,获取目标区域二值化掩膜结果;利用训练好的目标检测模型对图像中的异物目标进行检测,获取异物目标的类别和位置信息;再计算出异物目标的位置边界框内目标区域像素占比P,并据此判断异物目标的入侵状态;根据异物目标的类别信息,判定异物目标的入侵等级;最后根据异物目标的入侵状态和等级,发出对应的安全预警。本发明只需单帧图像就可以完成异物入侵检测,同时获取异物目标的入侵状态和入侵等级,为动态场景下各活动的安全预告预警提供准确可靠的依据。
-
公开(公告)号:CN112657176A
公开(公告)日:2021-04-16
申请号:CN202011642041.2
申请日:2020-12-31
Applicant: 华南理工大学
Abstract: 本发明公开了一种结合人像行为信息的双目投影人机交互方法,该方法包括:对摄像头捕获区域进行边缘检测;对边缘检测后的图像进行直线检测;通过单应性变换矩阵求解视角变换下的映射关系;利用YOLOv3目标检测算法对交互对象进行识别,获取从投影区域坐标映射到Unity3D开发场景中的游戏坐标;通过双目摄像头测距获得交互对象的深度信息;通过Kinect摄像头获得交互者的骨骼关键点位置,再在Uinty3D软件中虚拟化人物对象以及相应的交互动作;本发明能够利用深度学习的方法进行人机交互,同时结合双目摄像头测得的交互对象深度信息,以及交互者的人像行为信息,可以很大程度地提高投影人机交互系统的交互性。
-
公开(公告)号:CN112507963A
公开(公告)日:2021-03-16
申请号:CN202011530655.1
申请日:2020-12-22
Applicant: 华南理工大学
IPC: G06K9/00 , G06K9/62 , G06F16/583
Abstract: 本发明涉及一种批量口罩人脸样本自动生成以及口罩人脸识别方法,包括以下步骤:S1、定位人脸库中的无佩戴口罩人脸的关键点;S2、分别找到无口罩人脸的下巴以及鼻梁定位点;S3、将口罩图片与人脸的下巴以及鼻梁定位点进行对齐,自动生成口罩人脸图片,并将图片入库;S4、识别人脸时,通过检查关键点是否被遮挡来判断是否戴口罩;S5、根据步骤S4的判断,选取相似度高于阈值且相似度最高的人脸所对应的人员,完成人脸识别。本发明通过人脸关键点定位找出口罩区域并自动生成口罩人脸图片入库,通过与口罩人脸进行比对,不需要单独拍摄戴口罩人脸图片入库,也可以实现对戴口罩的人脸识别的目的。
-
公开(公告)号:CN109934116B
公开(公告)日:2020-11-24
申请号:CN201910121233.X
申请日:2019-02-19
Applicant: 华南理工大学
Abstract: 本发明公开了一种基于生成对抗机制与注意力机制的标准人脸生成方法,包括:数据集设计步骤,依据数据库相关标注数据,为一张人脸图像构建出具有多种非限制因素的人脸编码,以编码和人脸图像作为模型的输入;模型设计与训练步骤,利用生成对抗机制与注意力机制设计相应的网络结构,并利用所构建的数据对进行模型训练,进而获得网络模型权重;模型预测步骤,将获取的人脸图像通过模型进行预测。本发明将深度学习网络技术应用到标准人脸生成,用来生成彩色的、正向的、以及正常光照下的标准人脸图像;用深度学习网络的方法,能够获得准确的标准正脸照,减少与单样本数据库中数据的匹配难度,为后续人脸的特征提取与单样本人脸识别打下坚实基础。
-
-
-
-
-
-
-
-
-