-
公开(公告)号:CN116580150A
公开(公告)日:2023-08-11
申请号:CN202310477499.4
申请日:2023-04-28
Applicant: 浙江工商大学
IPC: G06T17/00 , G06V10/26 , G06V10/82 , G06V10/80 , G06V10/766 , G06V40/10 , G06N3/0455 , G06N3/0464 , G06N3/0985 , G06N3/09 , G06N5/04
Abstract: 本发明公开了一种基于多图像输入的单帧图像3D人体重建方法,该方法步骤包括:首先对原始单帧图像进行处理,生成2D关节点图以及2D分割图。再将上述的三种图像一起输入到网络的编码器进行特征提取。然后输入图像特征到解码器中,并推理获得SMPL人体参数。最后依据SMPL人体参数生成三维人体模型。本方法考虑了3D关节点损失、经过3D关节点投影所得的2D关节点损失、SMPL参数损失、判别器损失,以获取误差更小的3D人体网格模型。使用ResNeXt‑50‑CBAM网络作为人体重建网络的编码网络,借由ResNeXt的分组机制以及CBAM的注意力机制,提升网络的特征提取能力,最终降低人体重建网络的重建误差。
-
公开(公告)号:CN114862675A
公开(公告)日:2022-08-05
申请号:CN202210410719.7
申请日:2022-04-19
Applicant: 浙江工商大学
IPC: G06T3/40 , G06V10/26 , G06V10/82 , G06V10/764 , G06V10/774 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于超分辨率技术的细微物体分割方法及装置,可用于三维微小血管的分割。该方法包括以下步骤:1)构建超分辨率网络,提出一个结构保持的超分辨率网络,在保持血管结构信息的基础上,对微小血管进行超分辨率操作,获得更多细节信息;2)构建三维血管分割网络,该分割网络采用了U型的网络结构,在卷积层一层一层提取特征的同时将首尾对称的两层联系起来,实现特征的充分提取;3)利用超分辨率对数据进行处理,使用超分后的数据对分割网络进行训练,从而达到更好的分割效果。本发明通过超分辨率技术增强血管特性信息,从而对原有网络产生明显提升,实现高效准确的分割效果。
-
公开(公告)号:CN106228125B
公开(公告)日:2019-05-14
申请号:CN201610563188.X
申请日:2016-07-15
Applicant: 浙江工商大学
Abstract: 本发明公开了一种基于集成学习级联分类器的车道线检测方法,可以在单个CPU或DSP上实时的获取图中车道线准确的位置和方向信息,进而得到车道线方程,同时对交通场景的亮度变化具有一定鲁棒性。该检测方法过程:首先架设图像传感器,获取需提取车道线的彩色图像;然后基于前帧的检测结果提取感兴趣区域;再计算积分图和单尺度块LBP特征;接着采用集成学习遍历感兴趣区域,得到车道线细小区域;得到车道线细小区域后,最后使用基于最优化的办法得到车道线方程。
-
公开(公告)号:CN119625473A
公开(公告)日:2025-03-14
申请号:CN202411669222.2
申请日:2024-11-21
Applicant: 浙江工商大学
Abstract: 本发明公开了一种基于Mamba架构与多尺度特征融合的视频人体姿态估计方法及装置,该方法通过获取不同阶段的多尺度融合特征,利用前后帧包含的时序信息提取姿态线索,完成跨帧多尺度时序特征融合,帧内多尺度特征融合,残差解码操作,充分挖掘不同特征之间的信息;本发明采取先进的特征提取和增强策略,通过创新融合方法,提供更加丰富的特征信息,多尺度特征增强Mamba模块高效捕获数据依赖关系,聚焦人体特征内容,淡化背景干扰,进一步提升了特征的表达能力;本发明能够充分结合时序信息并深层挖掘姿态关系,显著提高了在视频场景下的人体姿态估计精度,具有一定的现实意义和应用价值,在安全防护、自动驾驶等行业方面具有重要意义。
-
公开(公告)号:CN119625414A
公开(公告)日:2025-03-14
申请号:CN202411732414.3
申请日:2024-11-29
Applicant: 浙江工商大学
IPC: G06V10/764 , G06V20/10 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/082
Abstract: 本发明公开了一种基于双分支多尺度CNN和记忆增强Transformer的高光谱图像分类方法及装置。具体包括:步骤1,获取高光谱图像数据并进行预处理。步骤2,将步骤1后的数据输入到双分支多尺度CNN特征提取模块,充分提取高光谱的空间特征和空间‑光谱联合特征。步骤3,将步骤2后的数据传入到记忆模块中,MT1对数据进行细节记忆和全局记忆,MT2对数据进行平常记忆和重要特征记忆。步骤4,将步骤2和步骤3后的数据作为输入传入记忆Transformer中,步骤5,最后经过mlp‑head层得到分类结果。本发明能够充分结合高光谱丰富的空间特征和光谱特征,提高高光谱图像的分类精度和分类性能。
-
公开(公告)号:CN118964514A
公开(公告)日:2024-11-15
申请号:CN202411421476.2
申请日:2024-10-12
Applicant: 浙江工商大学 , 衢州光明电力投资集团有限公司赋腾科技分公司
Abstract: 本发明公开了一种基于图数据库和向量数据库的数据处理和存储方法及装置。基于图数据库和向量数据库,结合LayoutLMv3模型、Transformer模型与OCR技术,旨在高效地解析、存储和检索非结构化文档。本发明首先将文档转换为图像,使用布局分析模型LayoutLMv3模型识别图像中的文本、图像、表格几类区域,然后使用三类解析器分析包含数据的区域,特别的,由于表格数据结构的复杂性,使用表格分析模型将表格转为文本表示,最后,将所得到的所有数据进行结构化分割,分别保存在图数据库和向量数据库中,以实现对数据检索的高准确性和高效率性,为大数据分析和大语言模型应用提供了强大的支持。
-
公开(公告)号:CN116977817A
公开(公告)日:2023-10-31
申请号:CN202310477517.9
申请日:2023-04-28
Applicant: 浙江工商大学
IPC: G06V10/82 , G06V10/80 , G06V10/52 , G06V10/77 , G06V10/42 , G06V10/44 , G06V40/10 , G06N3/0464 , G06N3/0455 , G06N3/048
Abstract: 本发明涉及一种基于多尺度特征学习的行人重识别方法,提出有效结合CNN和Transformer的优势,通过将CNN和Transformer两种结构结合对网络进行改进,由此提出了Transformer学习分支,并在局部分支加入了一种双层的特征金字塔结构,融合来自不同层次的特征信息,以获取行人图像中不同的语义和细节信息,并增强特征表达的能力。该种方式可以让模型保留CNN的较快推理速度的优势,并且可以避免全局替换Transformer所产生的速度慢和过度解耦的问题,从调整网络模型结构的角度上,利用Transformer的感受野更广的优势来建模相隔较远的像素点间之间的关系,提升模型的泛化能力。
-
公开(公告)号:CN111639563B
公开(公告)日:2023-07-18
申请号:CN202010419217.1
申请日:2020-05-18
Applicant: 浙江工商大学
IPC: G06V20/40 , G06V10/82 , G06V10/774 , G06N3/0464 , G06N3/084
Abstract: 本发明公开了一种基于多任务的篮球视频事件与目标在线检测方法,本发明利用深度卷积神经网络共享多任务权重,能以在线或离线的方式对篮球比赛视频进行事件检测和目标检测。基于多任务的混合损失函数将各自任务的损失分别反向传播到对应的分支,加快了各自任务分支学习的速度。将两种任务得到的损失依特定权重相加得到总体损失并反向传播,使得骨干网络学习到混合两种任务的潜在特征归纳方式。半监督伪标签挖掘扩充了训练数据,有效抑制了偏离事件高潮时刻生成的低质量事件预测框和偏离目标几何中心生成的低质量包围框。时空多尺度的网络结构充分利用了多步幅的时域信息,归纳出多尺度的历史特征,有效提高了事件检测的召回率和准确率。
-
公开(公告)号:CN111639571A
公开(公告)日:2020-09-08
申请号:CN202010433443.5
申请日:2020-05-20
Applicant: 浙江工商大学
Abstract: 本发明公开了一种基于轮廓卷神经网络的视频动作识别方法,首先对于带有标签的视频进行逐帧的剪裁处理,对于剪裁后的样本进行必要的增广操作;其次通过轮廓卷积操作ContourConv得到良好的分割结果并有效地提取出图片中有序的动作点云集合与几何特征;接着使用RGB与光流的双流网络对图片的表层特征进行提取;最终将上述两个分支进行模型融合,传入检测设备中,将传入到检测设备的特征图进行动作识别预测,得到最终的预测结果。本发明通过轮廓卷积将人体姿态的几何信息提取出来并作为行为识别网络的一个新的分支,从而对原有网络产生明显的提升作用,实现高效准确地视频动作识别。
-
公开(公告)号:CN111639563A
公开(公告)日:2020-09-08
申请号:CN202010419217.1
申请日:2020-05-18
Applicant: 浙江工商大学
Abstract: 本发明公开了一种基于多任务的篮球视频事件与目标在线检测方法,本发明利用深度卷积神经网络共享多任务权重,能以在线或离线的方式对篮球比赛视频进行事件检测和目标检测。基于多任务的混合损失函数将各自任务的损失分别反向传播到对应的分支,加快了各自任务分支学习的速度。将两种任务得到的损失依特定权重相加得到总体损失并反向传播,使得骨干网络学习到混合两种任务的潜在特征归纳方式。半监督伪标签挖掘扩充了训练数据,有效抑制了偏离事件高潮时刻生成的低质量事件预测框和偏离目标几何中心生成的低质量包围框。时空多尺度的网络结构充分利用了多步幅的时域信息,归纳出多尺度的历史特征,有效提高了事件检测的召回率和准确率。
-
-
-
-
-
-
-
-
-