-
公开(公告)号:CN106604029B
公开(公告)日:2019-07-12
申请号:CN201710000884.4
申请日:2017-01-03
Applicant: 华南理工大学
IPC: H04N19/114 , H04N19/172 , H04N19/543 , H04N19/147
Abstract: 本发明公开了一种基于HEVC的运动区域检测的码率控制方法,包括如下步骤:按照HEVC编码器的码率控制方法,编码第1个GOP;从第2个GOP开始,对于每一个I帧,采用基于帧间差分法的运动区域检测技术对每一个I帧的LCU进行标记,标记类型包括运动区域、一般区域和静止区域;根据进行标记后的LCU调整LCU的QP,下调标记为运动区域的LCU的QP,上调标记为静止区域的LCU的QP,将标记为一般区域的LCU的QP保持不变;根据调整后的QP采用HEVC编码器的码率控制方法编码I帧中的每个LCU;对于GOP中的B帧和P帧则按照HEVC编码器的码率控制方法进行编码。本发明在中低码率下能检测出视频内容中的视觉关注区域并保证其视觉质量,实现了快速的、准确的码率分配优化。
-
公开(公告)号:CN118196683A
公开(公告)日:2024-06-14
申请号:CN202410291163.3
申请日:2024-03-14
Applicant: 华南理工大学
Abstract: 本发明公开了一种基于显著性前景匹配的高速公路抛洒物检测方法,首先进行前景提取得到前景二值图fbinary和视频中运动的前景框集合;然后,基于道路分割去除不在路面上的前景框、基于YOLO检测并去除人和车前景框以及基于IOU静止判断去除非静止的前景框,得到抛洒物候选框。接着,将候选框b对应的当前帧局部图像输入到改进的PoolNet网络模型中得到显著性前景二值图像X1,将X1和b对应的局部图像X2∈fbinary进行相似性匹配,若匹配,则标示该候选框为抛洒物目标框。本发明提取前景框后既去除了噪声框,又基于显著性前景匹配对抛洒物进行确认,综合考虑了抛洒物的运动特性和图像特征。
-
公开(公告)号:CN116452853A
公开(公告)日:2023-07-18
申请号:CN202310274459.X
申请日:2023-03-21
Applicant: 华南理工大学
IPC: G06V10/764 , G06V10/56 , G06V10/28 , G06V10/44 , G06V10/82 , G06T7/90 , G06N3/0464 , G06N3/048 , G06N3/08 , G06V10/20 , G06T5/00 , G06T7/12
Abstract: 本发明公开了一种基于边缘检测和卷积神经网络的车辆颜色识别方法,该方法步骤如下:对车辆图像进行去雾预处理;对去雾后的车辆图像进行边缘检测和形态学操作,得到车辆有效颜色区域的二值掩码图像;构建并训练颜色识别卷积神经网络;输入去雾后的车辆图像和对应的二值掩码图像,输出图像对应的颜色类别。本发明通过边缘检测的方法提取车辆图像中有效颜色区域,综合了整体图像的全局特征和有效颜色区域的局部特征,提高了车辆颜色识别的效果,并在实际的交通卡口场景中验证了本发明的有效性。
-
公开(公告)号:CN116403414A
公开(公告)日:2023-07-07
申请号:CN202310291254.2
申请日:2023-03-22
Applicant: 华南理工大学
Abstract: 本发明公开了一种基于目标跟踪的交通视频逆行事件检测方法,该方法步骤如下:S1、对交通视频中道路区域进行划分,得到道路区域划分图;S2、利用目标跟踪,计算道路区域内所有车辆的平均行驶速度,以该速度方向作为道路区域的正确行驶方向,得到正确行驶方向字典;S3、针对交通视频中的所有车辆进行目标跟踪,使用光流法计算车辆当前速度方向并与正确行驶方向比较判断车辆当前帧是否逆行,得到所有车辆行驶情况记录;S4、如果一辆车在1s内半数以上的视频帧中被判为逆行车辆,则该车辆为逆行车辆,在交通视频中进行标示。本发明公开的全自动高速公路逆行检测方法在实际场景应用中验证了检测方法的有效性。
-
公开(公告)号:CN114694092A
公开(公告)日:2022-07-01
申请号:CN202210251759.1
申请日:2022-03-15
Applicant: 华南理工大学
Abstract: 本发明公开了一种基于混合背景模型的高速公路监控视频抛洒物检测方法,步骤如下:建立基背景模型,将高速公路监控视频输入基背景模型得到基背景视频;建立双背景变化模型,将基背景视频输入双背景变化模型,使用帧差法得到双背景变化模型的前景二值图;通过YOLO网络模型生成人车检测二值图;建立实时背景模型,记录高速公路监控视频中各帧的前景目标,并对相邻帧之间的前景目标进行匹配,生成静止物体位置二值图;将双背景变化模型的前景二值图、人车检测二值图与静止物体位置二值图进行按位“与”的逻辑操作,得到抛洒物在帧图像中的位置并标示。本发明公开的端到端的高速公路抛洒物检测方法在实际场景应用,验证了检测方法的有效性。
-
公开(公告)号:CN113380398A
公开(公告)日:2021-09-10
申请号:CN202110697683.0
申请日:2021-06-23
Applicant: 华南理工大学 , 中山大学附属第一医院
Abstract: 本发明公开了一个基于深度学习的骨巨细胞瘤病理辅助诊断系统,包括:图像数据预处理模块,通过筛除空白占比多的图像和对图像进行归一化操作,得到能够进行特征提取的图像数据;特征提取分类模块,将图像数据输入一个已经过预训练的神经网络模型,提取图像数据的特征,并根据特征给出诊断结果;训练模块,根据指定的训练次数,训练更新特征提取分类模块的参数,并保存诊断准确率最高的诊断系统模型参数;诊断模块,用于提供一个可视化界面,对病变组织病理学HE切片图像进行诊断。本发明系统的诊断准确率最高能达到90.6%,并且在训练时使用降维、瓶颈层、GAP等方法,大大减少了训练所需要的GPU计算资源,也避免了过拟合等问题的出现。
-
公开(公告)号:CN110543846A
公开(公告)日:2019-12-06
申请号:CN201910806159.5
申请日:2019-08-29
Applicant: 华南理工大学
Abstract: 本发明公开了一种基于生成对抗网络的多姿态人脸正面化方法,在训练阶段,首先收集各种姿态的人脸图片作为数据集,然后输入多组同一人的正脸图像和非正脸图像,通过新设计的损失函数,交替训练生成网络和判别网络,直到损失函数的值稳定收敛。在训练完成后的测试阶段,对输入的各种姿态人脸图片,本发明都可以将它们矫正成正脸图像。矫正后的图像不仅清晰,并且保留了原人脸的身份特征,可以用于人脸识别工作。本发明将有效减缓姿态因素对人脸识别造成的负面影响,有利于非限制条件下人脸识别实际应用的发展。
-
公开(公告)号:CN108921604A
公开(公告)日:2018-11-30
申请号:CN201810647829.9
申请日:2018-06-22
Applicant: 华南理工大学
Abstract: 本发明公开了一种基于代价敏感分类器集成的广告点击率预测方法,包括步骤:在特征提取上,采用人工定义的规则进行特征提取,对用户行为历史记录进行特征提取和采样;在广告点击率预测中采用改进B-SMOTE+方法进行数据过采样;经过数据预处理后的数据集在交由分类器学习时采用代价敏感算法,将误分“点击广告”这一错误加大惩罚力度;采用了遗传算法进行了优化调参;采用两层Stacking方式对进行集成。本发明解决了目前一些点击率预测算法由于特征维度较少、数据预处理不到位等问题导致的准确率较低等问题,采用该方法能够较好地提升广告点击率预测的准确率。
-
公开(公告)号:CN103079063B
公开(公告)日:2015-08-26
申请号:CN201210557415.X
申请日:2012-12-19
Applicant: 华南理工大学
IPC: H04N19/124 , H04N19/14 , H04N19/147
Abstract: 本发明为一种低码率下基于H.264的视觉关注区域的视频编码方法,包括步骤:判断当前编码帧类别,确定视觉关注区域、当前编码帧所有宏块的量化参数调整等级、当前编码帧所有宏块的视觉关注度权值;采用结构相似度SSIM作为失真准则进行宏块预测模式选择时RDO失真衡量标准;根据视觉关注度权值确定新的RDO代价计算公式;确定新的RDO代价计算公式中的经验值;根据新的RDO代价计算公式计算每种预测模式下的RDO代价;根据宏块等级重新分配每个宏块的编码量化参数;根据重新分配的量化参数编码当前编码帧的每个宏块;重复上述步骤直到编码结束。本发明可在码率非常有限的情况下优化码率分配,实现更符合人眼视觉特征的视频编码。
-
公开(公告)号:CN118072023A
公开(公告)日:2024-05-24
申请号:CN202410303700.1
申请日:2024-03-18
Applicant: 华南理工大学
Abstract: 本发明公开了一种基于语义分割和目标检测的高速公路车辆违停检测方法,首先,利用高斯背景建模获取离线监控视频的道路背景图,再使用语义分割神经网络划分出道路区域,排除后续非高速公路的误检。之后针对同一摄像头下要检测的交通视频,利用目标检测和跟踪获取车辆的运动状态,通过车辆运动状态的判别从而检测出违停车辆。本发明设计了一种可以自动判别车辆违停事件检测方法,在真实的高速公路交通视频中取得了优秀的车辆违停检测效果。
-
-
-
-
-
-
-
-
-