-
公开(公告)号:CN111144209A
公开(公告)日:2020-05-12
申请号:CN201911168427.1
申请日:2019-11-25
Applicant: 浙江工商大学
Abstract: 本发明提供一种基于异构多分支深度卷积神经网络的监控视频人头检测方法,可应用于视频监控领域中的各种小目标检测。为了提高目标检测算法的检测精度,对YOLOv3结构进行改造,将其主干网络修改为双主干网络结构,其中一个分支以DenseNet121网络为主干网络,去掉其最后的FC层,然后将其基础结构由CBL修改为BRC结构;另外一个分支采用Darknet53为主干网络,去掉其最后FC层,该分支的BRC结构不作修改。本发明设计的双主干结构网络模型取名为Dense_YOLO网络,通过两个不同结构的主干网络提取的特征进行特征融合,提高了检测效果,减少了误检和漏检,适用于小目标检测,效果优于以Darknet53作为主干网络的YOLOv3模型。
-
公开(公告)号:CN111079516A
公开(公告)日:2020-04-28
申请号:CN201911050215.3
申请日:2019-10-31
Applicant: 浙江工商大学
Abstract: 本发明针对行人步态分割时对双腿间的“O型”形状难以分割以及腿型分割不够精细的问题,提出一种基于深度神经网络的行人步态分割方法。本发明通过设计空洞卷积残差卷积网络和添加边缘检测器分支两步实现对行人步态的精细分割;利用空洞卷积替换resnet最后阶段的普通卷积来提高浅层网络的感受野,得到更多信息的特征传入到下个阶段,最后得到的mask再输入至由边缘检测算子组成的边缘检测器中,很好地解决了行人步态中步态边缘不拟合的问题,从而得到更加精确的行人步态边缘,提高了腿部分割的精细度。
-
公开(公告)号:CN106203318B
公开(公告)日:2019-06-11
申请号:CN201610524455.2
申请日:2016-06-29
Applicant: 浙江工商大学 , 浙江宇视科技有限公司
Abstract: 本发明公开了一种基于多层次深度特征融合的摄像机网络行人识别方法,其通过迁移预训练网络的参数到行人数据库,在行人数据库上学习了一个新的网络模型,利用新的网络模型提取多个不同层次的深度特征,并通过将卷积神经网络最后一层的Softmax分类器替换为SVM分类器,达到了充分利用多层深度特征的目的;进而利用不同层次的深度特征构造多组二分类的SVM分类器,并对这些二分类器的决策值进行线性加权得到最终分类结果。本发明在SVM分类器的决策层进行多层特征融合的方式能够有效提高对行人目标进行识别的准确率。
-
公开(公告)号:CN109376736A
公开(公告)日:2019-02-22
申请号:CN201811017919.6
申请日:2018-09-03
Applicant: 浙江工商大学
Inventor: 王慧燕
Abstract: 本发明提供一种基于深度卷积神经网络的视频小目标检测方法,利用深度卷积神经网络多层非线性结构的特性对视频目标特征进行整体建模,结合Faster RCNN对于普通视频目标检测快速准确的特点以及ResNet在深度网络特征提取层加入的effective path(多人投票系统),再加上后期对网络结构的精简,提出了一种可以对视频目标进行快速检测,同时兼顾小目标检测的基于深度网络结构ERF-Net(Efficient Residual Faster rcnn)的视频目标检测方法。本发明的优点如下:对视频中不同远近、不同尺度大小的目标进行准确、快速检测,提高了小目标检测的效果和效率,为后续的目标跟踪、目标再识别等提供了较好的基础。
-
公开(公告)号:CN104616032B
公开(公告)日:2018-02-09
申请号:CN201510047118.4
申请日:2015-01-30
Applicant: 浙江工商大学
Abstract: 一种基于深度卷积神经网络的多摄像机间的目标匹配方法。本发明基于局部保护投影方法初始化多个卷积核,基于最大值池化方法对图像进行下采样,通过逐层特征变换,提取更加鲁棒、更加具有代表性的直方图特征;再利用多类支持向量机SVM分类器进行分类识别。当目标从一个摄像机视野域进入另外一个摄像机视野域时,对其提取特征并标注对应的目标标签,实现在多摄像机协作监控领域对目标进行准确的识别,以用于目标交接及跟踪等。
-
公开(公告)号:CN103984953B
公开(公告)日:2017-06-06
申请号:CN201410164575.7
申请日:2014-04-23
Applicant: 浙江工商大学
Abstract: 一种基于多特征融合与Boosting决策森林的街景图像的语义分割方法,包括如下步骤:步骤1,对图像进行超像素分割;步骤2,多特征提取;步骤3,特征融合;步骤4,训练学习以及分类识别;本发明将2D特征和3D特征有效的融合在一起,显著的提高了目标的识别率,与现有技术相比,分割结果一致,连通性好,边缘定位准确,引入了Boosting决策森林分类机制,保证了目标分类的稳定性。
-
公开(公告)号:CN106228125A
公开(公告)日:2016-12-14
申请号:CN201610563188.X
申请日:2016-07-15
Applicant: 浙江工商大学
CPC classification number: G06K9/00798 , G06K9/6257
Abstract: 本发明公开了一种基于集成学习级联分类器的车道线检测方法,可以在单个CPU或DSP上实时的获取图中车道线准确的位置和方向信息,进而得到车道线方程,同时对交通场景的亮度变化具有一定鲁棒性。该检测方法过程:首先架设图像传感器,获取需提取车道线的彩色图像;然后基于前帧的检测结果提取感兴趣区域;再计算积分图和单尺度块LBP特征;接着采用集成学习遍历感兴趣区域,得到车道线细小区域;得到车道线细小区域后,最后使用基于最优化的办法得到车道线方程。
-
公开(公告)号:CN106203318A
公开(公告)日:2016-12-07
申请号:CN201610524455.2
申请日:2016-06-29
Applicant: 浙江工商大学
CPC classification number: G06K9/00335 , G06K9/00362 , G06K9/6269 , G06N3/0454 , G06N3/08
Abstract: 本发明公开了一种基于多层次深度特征融合的摄像机网络行人识别方法,其通过迁移预训练网络的参数到行人数据库,在行人数据库上学习了一个新的网络模型,利用新的网络模型提取多个不同层次的深度特征,并通过将卷积神经网络最后一层的Softmax分类器替换为SVM分类器,达到了充分利用多层深度特征的目的;进而利用不同层次的深度特征构造多组二分类的SVM分类器,并对这些二分类器的决策值进行线性加权得到最终分类结果。本发明在SVM分类器的决策层进行多层特征融合的方式能够有效提高对行人目标进行识别的准确率。
-
公开(公告)号:CN106157307A
公开(公告)日:2016-11-23
申请号:CN201610510552.6
申请日:2016-06-27
Applicant: 浙江工商大学
IPC: G06T7/00
CPC classification number: G03B13/30 , G02B27/0075 , G03B3/02 , G06K9/00228 , G06K9/62 , G06N3/08 , G06T7/00 , G06T7/579 , H04N13/271
Abstract: 本发明公开了一种基于多尺度CNN和连续CRF的单目图像深度估计方法,其利用CRF模型根据DCNN的输出深度图计算单点势能,根据输入RGB图像计算成对稀疏势能,最后用MAP(最大化后验概率)算法推导出优化的深度图。本发明结合了多尺度CNN和连续CRF优化思想,不仅能够以较高的精确度估计出深度图,又能使得到的深度图轮廓清晰;本发明所估计的深度有比较高的分辨率,而且所得到的深度图能保留场景中所有对象的深度细节信息,具有更好的视觉效果。
-
公开(公告)号:CN103985113A
公开(公告)日:2014-08-13
申请号:CN201410089643.8
申请日:2014-03-12
Applicant: 浙江工商大学
Abstract: 本发明提供一种舌像分割方法,包括对获取到的表征舌体信息的舌像进行预处理,得到均衡化的灰度图像。去除得到的均衡化的灰度图像的背景,得到基础舌像;和计算得到的均衡化的灰度图像的熵值。根据熵值对基础舌像内的像素进行熵聚类,提取熵值满足设定值的区域,形成目标舌像。抽取目标舌像的骨架。在骨架上选取至少两对控制点,计算上述控制点对之间的最短测地路径,依次连接所有最短测地路径,得到舌像轮廓。本发明提供的舌像分割方法,利用局部熵特征增强舌像边缘等底层特征,且通过抽取最短测地距离自动获取针对每个特定舌体的模版,大大提高了分割的精度,具有更高的鲁棒性。
-
-
-
-
-
-
-
-
-