-
公开(公告)号:CN118486084A
公开(公告)日:2024-08-13
申请号:CN202410712645.1
申请日:2024-06-04
Applicant: 华南农业大学
IPC: G06V40/20 , G06V20/40 , G06V10/44 , G06V10/42 , G06V10/52 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/045 , G06N3/0985 , G06N3/048
Abstract: 本发明公开了一种基于Multi‑YOWO的人体行为识别方法,该方法包括:通过采集得到的RGB视频数据生成骨骼热图组,根据骨骼热图组的活动区域对RGB关键帧进行裁剪;将获取得到的骨骼热图组和RGB关键帧输入到Multi‑YOWO模型中获得人体行为识别结果。Multi‑YOWO模型具体指将YOWO的3D主干网络3D‑ResNet替换为DC‑PoseC3D网络,其中DC‑PoseC3D网络是通过将ResNet模块中的1×1×1conv、1×3×3conv、1×1×1conv依次替换为1×1×1GSconv、1×3×3DC‑GSconv、1×1×1GSconv,并且在1×1×1GSconv之后增加SA注意力模块所得,其中DC‑GSconv是通过将GSconv中的普通卷积替换为分组且空洞率不同的空洞卷积所得。
-
公开(公告)号:CN118485946A
公开(公告)日:2024-08-13
申请号:CN202410712286.X
申请日:2024-06-04
Applicant: 华南农业大学
IPC: G06V20/40 , G06V20/52 , G06V10/44 , G06V10/42 , G06V10/80 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/0455 , G06N3/088
Abstract: 本发明公开了一种基于局部‑全局存储器U‑Net的视频异常检测算法。该算法首先采集正常和异常的视频,并对视频进行预处理以得到训练样本。然后,通过U‑Net的编码器将训练样本进行编码得到特征图,将特征图输入到局部‑全局存储器中进行查询,同时根据查询分数来更新局部和全局存储器。接着,通过U‑Net的解码器将特征图重构为预测帧,并进行自适应误差矫正。最后,通过最小化正常数据的重建损失,将视频序列输入到包含局部‑全局存储器的U‑Net深度神经网络中判断是否发生异常事件。本发明通过局部‑全局存储器保存了正常视频序列的局部和全局信息的正常原型,提高了深度神经网络对异常事件的识别能力,通过自适应误差纠正模块,缓解了存储器的累计误差缺陷,有效提高了异常检测的鲁棒性和稳定性。
-
公开(公告)号:CN110363095B
公开(公告)日:2023-07-04
申请号:CN201910536393.0
申请日:2019-06-20
Applicant: 华南农业大学
IPC: G06V30/412 , G06V30/413 , G06V30/22 , G06V30/164 , G06V30/146
Abstract: 本发明公开的一种针对表格字体的识别方法,包括以下步骤:获取表格图像,对表格图像进行预处理,包括:图像灰度化、图像去噪、图像倾斜校正;然后进行表格提取,提取表格横线、提取表格竖线、合并表格线段,去除不合格的表格线,得到完整表格;对完整表格进行定位截取,获取表格内容在完整表格中的定位;对定位截取内容进行表格内容提取,获取表格内容;使用识别技术对表格内容进行识别,得到初步识别结果,并分别训练对应的语言库,使用对应的语言库对初步识别结果进行选举,得到最终识别结果;本发明能够对多种格式的表格进行准确定位提取表格线和表格结构,能避免虚线和细线的对表格提取的干扰,能同时对印刷体和手写体进行准确识别。
-
公开(公告)号:CN118982843A
公开(公告)日:2024-11-19
申请号:CN202411062312.5
申请日:2024-08-05
Applicant: 华南农业大学
IPC: G06V40/10 , G06V10/26 , G06T5/50 , G06V10/764 , G06V10/774 , G06T5/77 , G06T3/4007 , G06N3/048 , G06N3/0464 , G06N3/084
Abstract: 本发明公开一种基于深度学习的轻量型恶劣环境下行人检测方法,该方法包括以下步骤:(1)采集复杂道路场景下的多模态数据进行预处理和标注;(2)通过DIVFusion对采集的多模态数据进行融合以得到融合数据;(3)对融合数据进行曝光校正与降噪;(4)改进YOLO‑MS检测网络;(5)利用训练出的改进YOLO‑MS检测模型完成行人检测;该方法采用可见光与红外融合的技术,设计了语义分割模块、降噪模块和轻量型的检测模块,对于恶劣环境下的行人检测有较大的提升,尤其是对于黑暗环境和如雨、雪、雾等复杂环境下的行人检测。
-
公开(公告)号:CN118710931A
公开(公告)日:2024-09-27
申请号:CN202410713133.7
申请日:2024-06-04
Applicant: 华南农业大学
IPC: G06V10/62 , G06V10/25 , G06V40/20 , G06V20/40 , G06V10/26 , G06V20/70 , G06V10/44 , G06V10/42 , G06V10/52 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/045 , G06N3/0475 , G06N3/084 , G06N3/094 , G06N3/048
Abstract: 本发明公开一种基于基于改进SiamFC的人体头肩小目标跟踪方法,该方法对数据集通过背景差分算法完成半自动标注,并使用LabelImage进行手动标注获得丰富的训练样本;引入改进的通道注意力机制SE模块改进特征提取,从而构建SEMC特征提取模块;构建ASPP‑M多尺度空洞卷积模块,基于ASPP模块增加LEDIO模块进行多尺度卷积的预处理,引入SURF‑PCA模块和拉普拉斯滤波器与多尺度特征图进行特征融合;改进SiamFC主干网络AlexNet特征提取模块,引入混合高斯模型进行背景建模,引入SEMC模块和ASPP‑M模块,引入激活函数Relu和LRN局部归一,并增加残差连接。该方法增强了在复杂场景下人体头肩目标的跟踪能力;缓解网络训练时可能出现的梯度消失情形。
-
公开(公告)号:CN110674779B
公开(公告)日:2023-06-20
申请号:CN201910943722.3
申请日:2019-09-30
Applicant: 华南农业大学 , 广州飒特红外科技有限公司 , 广州飒特红外股份有限公司
IPC: G06V20/58 , G06V10/34 , G06V10/26 , G06V10/764 , G06V10/25 , G06V10/50 , G06V10/44 , G06V10/54 , G06V10/774 , G06V10/80 , G06V40/10
Abstract: 本发明公开了一种基于特征融合的单目远红外行人检测方法,包括以下步骤:对原始红外图像按不同比例进行缩放,得到相应的缩放红外图像;对缩放红外图像使用局部自适应双阈值分割二值化;将得到的二值图进行形态学处理;搜索处理后的二值图,并进行过滤,得到初步候选区域(ROIs);将初步ROIs进行滑窗,得到一系列滑窗ROIs;对ROIs计算特征值,再进行归一化处理后输入第一个支持向量机(SVM)分类器和第二个SVM个分类器级联进行决策,得到初步行人检测框;调用非极大值抑制算法对初步行人检测框进行计算,得到最终行人检测框;本发明能适应不同距离检测,克服行人图像断裂情况,且提高了行人检测准确性。
-
公开(公告)号:CN110706235B
公开(公告)日:2023-05-23
申请号:CN201910812839.8
申请日:2019-08-30
Applicant: 华南农业大学
IPC: G06T7/11 , G06T7/136 , G06T7/187 , G06V10/764
Abstract: 本发明公开了一种基于双级级联分割的远红外行人检测方法,本发明采用中值滤波和拉普拉斯积分的预处理可以使得图像的轮廓加强;基于图模型的快速图像分割方法可以将图像中具有相近亮度的区域进行合并,从而可以列举出图像中可能存在物体的各局部区域;双阈值法和基于图模型的快速图像分割方法的联用可以使得分割结果更加的准确;基于先验知识层级合并的候选区域列举根据人体成像的特点,对人体区域优先进行合并,提高感兴趣区域的准确率,采用聚合通道特征和高低频红外图像有效的提高了系统的鲁棒性和实时性,二级级联分类器的使用使得分类结果更加的准确。
-
公开(公告)号:CN110706235A
公开(公告)日:2020-01-17
申请号:CN201910812839.8
申请日:2019-08-30
Applicant: 华南农业大学
Abstract: 本发明公开了一种基于双级级联分割的远红外行人检测方法,本发明采用中值滤波和拉普拉斯积分的预处理可以使得图像的轮廓加强;基于图模型的快速图像分割方法可以将图像中具有相近亮度的区域进行合并,从而可以列举出图像中可能存在物体的各局部区域;双阈值法和基于图模型的快速图像分割方法的联用可以使得分割结果更加的准确;基于先验知识层级合并的候选区域列举根据人体成像的特点,对人体区域优先进行合并,提高感兴趣区域的准确率,采用聚合通道特征和高低频红外图像有效的提高了系统的鲁棒性和实时性,二级级联分类器的使用使得分类结果更加的准确。
-
公开(公告)号:CN119478442A
公开(公告)日:2025-02-18
申请号:CN202411576560.1
申请日:2024-11-06
Applicant: 华南农业大学
IPC: G06V10/44 , G06V10/40 , G06V40/10 , G06V10/82 , G06V10/77 , G06N3/0464 , G06N3/0455 , G06N3/048 , G06N3/084
Abstract: 本发明公开一种改进的YOLOv7人体关键点检测方法,该方法通过LabelImage进行手动标注获得丰富的训练样本;将YOLOv7中原有的MP模块替换为L‑MP模块改进特征提取,新增LiftDown Pool分支和残差连接;在YOLOv7网络的Backbone模块和Head模块之间新增EDH‑Conv模块,利用其输出作为空间权重分布来矫正激活区域,进一步提升了网络对小目标的检测能力;增加改进的RSwin Transformer编码器,用于提升对复杂场景中小目标和重叠目标的检测效果;将损失函数参照Wise‑IoU LOSS改为基于L2损失的改进关键点检测损失,并引入用于调整关键点误差权重的动态聚焦机制,加速模型的收敛。该方法增强了对于复杂场景下的人体关键点检测识别能力,对于体育运动中人体关键点检测识别与计数任务有更强的鲁棒性、准确率和效率。
-
公开(公告)号:CN118485947A
公开(公告)日:2024-08-13
申请号:CN202410712382.4
申请日:2024-06-04
Applicant: 华南农业大学
IPC: G06V20/40 , G06V20/52 , G06V10/44 , G06V10/42 , G06V10/62 , G06V10/80 , G06V10/764 , G06V10/82 , G06N3/042 , G06N3/0464 , G06N3/0455 , G06N3/0985 , G06N3/0895 , G06N3/048
Abstract: 本发明公开了一种基于特征解耦的弱监督视频异常检测方法。该方法首先采集正常和异常视频构建训练数据集,然后利用预训练的视觉‑语言模型获取视频和文本标签的嵌入表示。接着,通过构建局部‑全局时间模块,将视频特征分别从局部和全局的时间依赖性进行建模,以更好地捕获视频中的时间信息。此外,通过特征解耦模块将视频特征和文本标签的共享特征有效地解耦,并将文本标签的共享特征融入到视频特征中,以增强视频特征的表示能力。最后,通过构建分类网络和使用多实例学习方法训练整个神经网络,实现对视频异常事件的准确检测。本发明通过局部‑全局时间模块的设计,有效地捕获了视频数据中的时间依赖,并通过特征解耦模块将视频特征与文本标签特征进行有效地解耦,通过将视频特征和文本标签共享特征的有效融合,提高了视频特征的表示能力。
-
-
-
-
-
-
-
-
-