-
公开(公告)号:CN113052073B
公开(公告)日:2024-09-27
申请号:CN202110319209.4
申请日:2021-03-25
Applicant: 浙江工业大学
IPC: G06V20/40 , G06V10/74 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 一种基于元学习的少样本行为识别方法,包括以下步骤:1)视频数据集分为元训练集和元测试集,从元训练集中抽取多组支持集和询问集用于训练模型,从元测试集中抽取多组支持集和询问集用于测试模型;2)使用浅层三维卷积神经网络提取支持集和询问集的视频特征;3)构建一种元学习网络,用于对支持集进行建模,生成步骤2)中浅层三维卷积神经网络参数;4)对步骤2)提取到的视频特征进行二阶变换和归一化处理;5)将处理后的支持集和询问集视频特征进行拼接,采用多层二维卷积神经网络提取询问集和支持集视频特征之间的非线性距离关系,对训练集视频进行分类。本发明具有较好的任务间泛化能力以及对新视频行为的识别准确率。
-
公开(公告)号:CN113052073A
公开(公告)日:2021-06-29
申请号:CN202110319209.4
申请日:2021-03-25
Applicant: 浙江工业大学
Abstract: 一种基于元学习的少样本行为识别方法,包括以下步骤:1)视频数据集分为元训练集和元测试集,从元训练集中抽取多组支持集和询问集用于训练模型,从元测试集中抽取多组支持集和询问集用于测试模型;2)使用浅层三维卷积神经网络提取支持集和询问集的视频特征;3)构建一种元学习网络,用于对支持集进行建模,生成步骤2)中浅层三维卷积神经网络参数;4)对步骤2)提取到的视频特征进行二阶变换和归一化处理;5)将处理后的支持集和询问集视频特征进行拼接,采用多层二维卷积神经网络提取询问集和支持集视频特征之间的非线性距离关系,对训练集视频进行分类。本发明具有较好的任务间泛化能力以及对新视频行为的识别准确率。
-
-
公开(公告)号:CN113378890B
公开(公告)日:2024-03-22
申请号:CN202110533245.0
申请日:2021-05-17
Applicant: 浙江工业大学
IPC: G06V10/82 , G06V10/762 , G06V10/74 , G06V10/80 , G06V10/40 , G06N3/0464 , G06N3/045 , G06N3/08 , G06V20/58
Abstract: 一种基于改进YOLO v4的轻量级行人车辆检测方法,包括以下步骤:1)将数据集划分为训练集、验证集和测试集;2)对数据集标签中的真实目标框进行聚类分析,获得先验框尺寸;3)利用Ghost模块搭建主干网络,用于提取数据集的视觉特征,在保证特征质量的同时缩减参数量;4)使用不同扩张率的空洞卷积提升网络的多尺度感知能力;5)对提取到的特征进行特征聚合;6)将聚合后的特征输入检测头,对目标的位置和类别进行预测,利用损失函数训练模型;7)将测试集图像输入训练得到的网络模型进行检测,输出目标的检测结果。本发明在保证行人车辆检测精度的同时,拥有较小的模型参数量,检测速度较快,降低了对于硬件设备性能的需求。
-
公开(公告)号:CN113378890A
公开(公告)日:2021-09-10
申请号:CN202110533245.0
申请日:2021-05-17
Applicant: 浙江工业大学
Abstract: 一种基于改进YOLO v4的轻量级行人车辆检测方法,包括以下步骤:1)将数据集划分为训练集、验证集和测试集;2)对数据集标签中的真实目标框进行聚类分析,获得先验框尺寸;3)利用Ghost模块搭建主干网络,用于提取数据集的视觉特征,在保证特征质量的同时缩减参数量;4)使用不同扩张率的空洞卷积提升网络的多尺度感知能力;5)对提取到的特征进行特征聚合;6)将聚合后的特征输入检测头,对目标的位置和类别进行预测,利用损失函数训练模型;7)将测试集图像输入训练得到的网络模型进行检测,输出目标的检测结果。本发明在保证行人车辆检测精度的同时,拥有较小的模型参数量,检测速度较快,降低了对于硬件设备性能的需求。
-
公开(公告)号:CN114821411A
公开(公告)日:2022-07-29
申请号:CN202210399070.3
申请日:2022-04-15
Applicant: 浙江工业大学
IPC: G06V20/40 , G06V40/10 , G06V10/26 , G06V10/28 , G06V10/62 , G06V10/94 , G06V10/82 , G06T7/254 , G06F16/71 , G06F16/783 , G06N3/04 , G06N3/08
Abstract: 一种基于昇腾处理器的边端监控视频结构化存储方法,包括:搭建基于国产昇腾处理器的边端硬件系统;根据监控摄像头视频流实时更新背景图像;根据上一步得到的二值化矩阵Bi进行椒盐去噪,找出其像素点值为1的总点数c,设置阈值Tc,若c>Tc则表示存在运动目标,使用YOLOV3算法进行目标检测,将框选出来的行人图像分割出来,并且送入到行人外观提取网络提取外观标签;对于目标检测网络,如果提取到了行人目标则将该帧合并入H264文件,生成关于关键视频段和行人目标的标签信息;将H264放在SD卡中,当缓存的数据达到SD卡存储上限后会定期向服务器进行备份。本发明加快了监控视频突发事件处理的实时性和响应速度,减少了服务器的计算压力。
-
-
-
-
-