-
公开(公告)号:CN110991311A
公开(公告)日:2020-04-10
申请号:CN201911188895.5
申请日:2019-11-28
Applicant: 江南大学
Abstract: 本发明公开了一种基于密集连接深度网络的目标检测方法,属于目标检测技术领域。本发明的基于密集连接深度网络的目标检测的方法将密集连接方式融合进yolo-tiny网络,增加其卷积层,改进特征提取网络。改进网络首先将输入图像归一化为固定大小,然后使用DenseBlock模块提取、融合各通道的特征,接着在不同的尺度上使用不同的先验框进行预测,完成目标的分类和定位。改进后的算法相比于原算法,精度提高了15%,且仍能达到实时检测的要求;模型大小也仅有44.7MB,能够满足实际使用中对于内存占用以及实时性的要求。
-
公开(公告)号:CN110009717A
公开(公告)日:2019-07-12
申请号:CN201910256680.6
申请日:2019-04-01
Applicant: 江南大学
Abstract: 本发明公开了一种基于单目深度图的动画人物绑定录制系统,属于视频人体姿态估计技术领域。该系统中,数据处理过程基于机器学习与深度学习框架,从单目深度图出发,利用三维信息深度学习网络,估计出图中人体关节点坐标,将人体关节点坐标估计值引入动画人物绑定录制系统,并采用过滤算法进行平滑处理,实现关节点与动画人物绑定录制系统中动画人物的绑定。通过利用三维信息深度学习网络实现对关节点坐标的估计,将关节点坐标估计值引入动画人物绑定录制系统中,使得对图中人体关节点坐标的估计值更加精确,从而在动画人物绑定录制,能够使得拍摄画面中人体动作准确体现在动画人物上,实现关节点与动画人物绑定录制系统中动画人物的精确绑定。
-
公开(公告)号:CN105447448B
公开(公告)日:2019-01-11
申请号:CN201510770266.9
申请日:2015-11-12
Applicant: 江南大学
IPC: G06K9/00
Abstract: 本发明提供了一种基于高斯颜色距离的卡口车辆定位方法,该方法首先将图像分为4*4共16幅的子图像,计算每一幅子图像的灰度标准偏差,取标准偏差最小的三幅图像,基于灰度二值化对其进行进一步分割并计算分割后每部分像素的灰度标准偏差,将其中灰度标准偏差较小的部分的所有像素放入道路区域像素集合中,并从中提取出道路区域特征向量;然后对每一幅子图像进行k‑means聚类,提取每个聚类像素的特征向量,并计算该特征向量与道路区域特征向量的高斯距离,得到高斯距离图。对该图进行二值化并加以数学形态学处理,得到车辆目标区域。该方法准确率较高,定位精准高,运行时间少,可满足实际应用要求。
-
公开(公告)号:CN105354533B
公开(公告)日:2018-11-09
申请号:CN201510625981.3
申请日:2015-09-28
Applicant: 江南大学
Abstract: 本发明提供了一种基于词袋模型的卡口无牌车辆车型识别方法,该方法首先基于直方图完成车辆检测,基于梯度密度完成车脸定位,之后基于词袋模型进行车型分类,包括训练与测试两部分,并针对词袋模型忽略词汇之间关联而导致分类效果不佳的问题,对空间信息进行构造。在构造空间信息时,分为全局空间信息与局部空间信息两部分进行计算,其中全局空间信息的获取来自相同标记图像块间的空间角度关系,首先将图像相同标记的图像块按到原点的距离大小进行排序,并依次计算相邻两图像块与横轴之间的夹角,统计关于各个标记的全局角度直方图信息;局部信息则按照特定方法计算相同标记块出现的局部频率直方图。将二者直方图信息结合起来,完成词袋空间信息的构造。该方法准确率较高,且在定位精准上,对车脸定位要求较低,运行时间少,可满足一般应用要求。
-
公开(公告)号:CN107045520A
公开(公告)日:2017-08-15
申请号:CN201611077648.4
申请日:2016-11-29
Applicant: 江南大学
Abstract: 本发明提供了一种基于位置信息加权词汇树的车辆图像检索方法,发明首先提取训练图像的车辆部分,然后对车辆部分提取局部特征,利用分层K均值方法将局部特征量化为视觉单词词汇树,然后将测试图像提取车身部分并提取其局部特征,再将局部特征分配到对应的视觉单词,同时计算局部特征点的空间位置影响信息,并根据特征点与视觉单词之间的从属关系,将特征点的空间位置信息聚类为视觉单词之间的位置影响,然后将视觉单词的空间位置信息作为加权系数,加入到视觉单词的权值匹配中,最后通过相似度排序检索相似图像。该方法在不影响检索时间的基础上,提高了车辆图像的检索准确率,可满足实际应用要求。
-
公开(公告)号:CN102298768A
公开(公告)日:2011-12-28
申请号:CN201010217942.7
申请日:2010-06-24
Applicant: 江南大学
IPC: G06T5/00
Abstract: 本发明公开了一种基于稀疏样本的高分辨图像重建方法,属于图像处理领域。该方法的实现过程为:首先以原始低分辨率图像为低频,以零矩阵为三个方向的高频,进行小波反变换完成图像初始化,然后利用轮廓波分解初始图像,在分解域优化系数,并在其周围建立邻域向量,最后利用训练阶段得到的高、低分辨率稀疏系数邻域向量的映射函数和邻域融合,得到高分辨率轮廓波系数,通过轮廓波反变换得到高分辨率重建图像。本发明利用轮廓波系数的方向性提高图像细小纹理的重建精度,利用轮廓波系数的稀疏性提高图像的重建速度,利用轮廓波系数优化处理抑制了可能存在的噪声干扰。通过对几种图像重建方法的比较,本发明的重建方法峰值信噪比最高,视觉效果最好。
-
公开(公告)号:CN113536015B
公开(公告)日:2025-04-29
申请号:CN202110754834.1
申请日:2021-07-02
Applicant: 江南大学
IPC: G06F16/583 , G06F16/58 , G06F16/334 , G06F16/353 , G06F16/383 , G06N3/0455 , G06N3/084 , G06N3/09 , G06N3/096 , G06N3/0985
Abstract: 本发明公开了一种基于深度辨识度迁移的跨模态检索方法,属于信息检索技术领域。所述方法在学习不同模态数据公共表示特征的过程中,通过最小化解码向量与文本原始特征间的重建损失增强文本公共表示特征的语义辨识度,同时通过权重共享层的模态不变损失和样本相关性损失将文本公共表示特征的语义高辨识度迁移到图片公共表示特征,从而为各模态数据习得高语义辨识度的公共表示特征,进而提升了检索性能。
-
公开(公告)号:CN113361475B
公开(公告)日:2025-04-04
申请号:CN202110748340.2
申请日:2021-06-30
Applicant: 江南大学
IPC: G06V40/10 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于多阶段特征融合信息复用的多光谱行人检测方法,属于多模态信息处理技术领域。所述方法包括:将成对的红外和可见光图片经由双流VGG16网络分别提取中间层特征做早期特征堆叠融合,获得早期融合特征,并基于融合特征生成行人建议。将生成的每一个行人建议先映射回三个多模态特征进行多特征池化,再进行高层池化特征加权融合,同时使用高低层特征池化策略组合池化特征,以完成高低层特征的联合。最后将池化特征送入全连接层完成检测任务。实验结果表明:在KAIST多光谱行人检测数据集上,获得76.24%的行人检测精度,行人平均漏检率下降至27.63%。
-
公开(公告)号:CN118365616A
公开(公告)日:2024-07-19
申请号:CN202410516969.8
申请日:2024-04-28
Applicant: 江南大学
IPC: G06T7/00 , G06N3/0455 , G06N3/0464 , G06N3/044 , G06N3/08 , G06N5/022
Abstract: 本发明公开了基于位置感知循环卷积的逆蒸馏缺陷检测方法,属于目标检测技术领域。所述方法首先通过使用全局核和循环卷积的方式,增加了网络的感受野,从而有效地提取教师网络的全局特征,增强了对图像异常区域的关注度,提高了模型的检测能力;同时,该方法在卷积之前引入了位置嵌入,增强了模块对特征空间信息的敏感性,提高了模型的异常定位和分割能力。此外,为了使学生网络更好地学习教师网络的丰富知识,本发明在教师‑学生网络的层间关系上加入了额外的约束,除了使用余弦函数损失,还使用了Gram矩阵来度量教师网络特征之间的关系,从而提高了学生网络的学习能力,最后在MVTec AD数据集上进行了实验验证,结果表明了本发明的显著提升了缺陷检测的精度。
-
公开(公告)号:CN113705359B
公开(公告)日:2024-05-03
申请号:CN202110883847.9
申请日:2021-08-03
Applicant: 江南大学
IPC: G06V20/10 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/047 , G06N3/09
Abstract: 本发明公开了一种基于洗衣机滚筒图像的多尺度衣物检测系统及方法,属于2D图像目标检测技术领域。所述系统包括:改进的ResNet101网络模块、特征增强模块SRM、动态感受野DRF模块、动态可变形卷积DDH模块;在实现衣物检测时,首先利用改进的ResNet101网络模块和SRM模块得到高质量的浅层特征,通过对浅层特征进行回归操作以最大保留衣物目标的定位信息;再通过DRF模块构建出语义信息更强的金字塔结构,在综合利用各尺寸特征的同时,对衣物目标进行分类和进一步的定位校准;DDH模块对检测框的偏移作用丰富了预测尺度的多样性;本发明有效地提高了滚筒洗衣机衣物的识别分类能力,提高了衣物检测精度,可应用于洗衣机内复杂衣物的检测场景。
-
-
-
-
-
-
-
-
-