-
公开(公告)号:CN118710931A
公开(公告)日:2024-09-27
申请号:CN202410713133.7
申请日:2024-06-04
Applicant: 华南农业大学
IPC: G06V10/62 , G06V10/25 , G06V40/20 , G06V20/40 , G06V10/26 , G06V20/70 , G06V10/44 , G06V10/42 , G06V10/52 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/045 , G06N3/0475 , G06N3/084 , G06N3/094 , G06N3/048
Abstract: 本发明公开一种基于基于改进SiamFC的人体头肩小目标跟踪方法,该方法对数据集通过背景差分算法完成半自动标注,并使用LabelImage进行手动标注获得丰富的训练样本;引入改进的通道注意力机制SE模块改进特征提取,从而构建SEMC特征提取模块;构建ASPP‑M多尺度空洞卷积模块,基于ASPP模块增加LEDIO模块进行多尺度卷积的预处理,引入SURF‑PCA模块和拉普拉斯滤波器与多尺度特征图进行特征融合;改进SiamFC主干网络AlexNet特征提取模块,引入混合高斯模型进行背景建模,引入SEMC模块和ASPP‑M模块,引入激活函数Relu和LRN局部归一,并增加残差连接。该方法增强了在复杂场景下人体头肩目标的跟踪能力;缓解网络训练时可能出现的梯度消失情形。
-
公开(公告)号:CN119107484A
公开(公告)日:2024-12-10
申请号:CN202411062384.X
申请日:2024-08-05
Applicant: 华南农业大学
IPC: G06V10/764 , G06V10/80 , G06V10/74 , G06N3/0455 , G06N3/0464 , G06N3/084
Abstract: 本发明设计了一种基于深度学习的零样本图像目标检测方法,属于基于大模型的图像目标检测领域。本发明设计的视觉语言模型包含RO‑Yolo‑Backbone、HWD‑RepVL‑PAN、MCJ‑Text Contrastive Head和回归边界框目标检测模块,通过对卷积核参数共享、感受野范围的优化,增强特征提取能力,利用小波变换减少下采样纹理损失,引入多距离公式弱化类内差异和增强类间差异,旨在有效提升大数据时代下的零样本图像目标检测能力。
-
公开(公告)号:CN118486084A
公开(公告)日:2024-08-13
申请号:CN202410712645.1
申请日:2024-06-04
Applicant: 华南农业大学
IPC: G06V40/20 , G06V20/40 , G06V10/44 , G06V10/42 , G06V10/52 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/045 , G06N3/0985 , G06N3/048
Abstract: 本发明公开了一种基于Multi‑YOWO的人体行为识别方法,该方法包括:通过采集得到的RGB视频数据生成骨骼热图组,根据骨骼热图组的活动区域对RGB关键帧进行裁剪;将获取得到的骨骼热图组和RGB关键帧输入到Multi‑YOWO模型中获得人体行为识别结果。Multi‑YOWO模型具体指将YOWO的3D主干网络3D‑ResNet替换为DC‑PoseC3D网络,其中DC‑PoseC3D网络是通过将ResNet模块中的1×1×1conv、1×3×3conv、1×1×1conv依次替换为1×1×1GSconv、1×3×3DC‑GSconv、1×1×1GSconv,并且在1×1×1GSconv之后增加SA注意力模块所得,其中DC‑GSconv是通过将GSconv中的普通卷积替换为分组且空洞率不同的空洞卷积所得。
-
公开(公告)号:CN118485946A
公开(公告)日:2024-08-13
申请号:CN202410712286.X
申请日:2024-06-04
Applicant: 华南农业大学
IPC: G06V20/40 , G06V20/52 , G06V10/44 , G06V10/42 , G06V10/80 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/0455 , G06N3/088
Abstract: 本发明公开了一种基于局部‑全局存储器U‑Net的视频异常检测算法。该算法首先采集正常和异常的视频,并对视频进行预处理以得到训练样本。然后,通过U‑Net的编码器将训练样本进行编码得到特征图,将特征图输入到局部‑全局存储器中进行查询,同时根据查询分数来更新局部和全局存储器。接着,通过U‑Net的解码器将特征图重构为预测帧,并进行自适应误差矫正。最后,通过最小化正常数据的重建损失,将视频序列输入到包含局部‑全局存储器的U‑Net深度神经网络中判断是否发生异常事件。本发明通过局部‑全局存储器保存了正常视频序列的局部和全局信息的正常原型,提高了深度神经网络对异常事件的识别能力,通过自适应误差纠正模块,缓解了存储器的累计误差缺陷,有效提高了异常检测的鲁棒性和稳定性。
-
-
-