-
公开(公告)号:CN118135298A
公开(公告)日:2024-06-04
申请号:CN202410228099.4
申请日:2024-02-29
Applicant: 浙江工业大学
IPC: G06V10/764 , G06V10/774 , G06V10/766 , G06V10/74 , G06V10/82 , G06V10/25 , G06N3/0455 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了基于语义增强特征生成和预测优化的小样本目标检测方法,构建小样本目标检测模型,所述小样本目标检测模型包括查询分支、支持分支、类无关聚合模块、检测头和检测结果优化模块,并构建特征生成器训练所述小样本目标检测模型。所构建的特征生成器,整合语义和视觉信息,允许生成器通过跨模态约束来加强以类别为中心的表示,从而在确保提高数据多样性的同时,明确不同类别的边界。此外,本发明公开的预测优化模块,它能准确地过滤掉边界框偏移造成的潜在误报,确保只留下最可靠的检测结果。本发明提出的方法比其他方法取得了更加领先的性能。
-
公开(公告)号:CN117372932A
公开(公告)日:2024-01-09
申请号:CN202311449597.3
申请日:2023-11-02
Applicant: 浙江工业大学
IPC: G06V20/40 , G06V10/82 , G06V10/764 , G06N3/045 , G06N3/0464 , G06N3/048 , G06N3/084 , G06N3/0895
Abstract: 本发明属于时序动作定位技术领域,公开了一种基于自适应时序特征增强的弱监督时序动作定位方法,通过对原始RGB和光流特征进行时序增强,实现更好的动作分类与定位性能。值得注意的是,与以前的方法相比,由于可变形卷积动态的感受野,本申请方法可以自适应地学习动作内部以及动作与背景间复杂多变的时序关系。此外,本申请引入了教师模型来更好地利用学习到时序信息,并指导模态共识的训练。本申请提高了弱监督时序动作定位任务的精度,在两个流行的数据集上比最近的方法取得了领先的性能。
-
公开(公告)号:CN117372651A
公开(公告)日:2024-01-09
申请号:CN202311449598.8
申请日:2023-11-02
Applicant: 浙江工业大学
IPC: G06T17/20 , G06N3/0455 , G06N3/082 , G06N3/0464
Abstract: 本发明属于单目三维人体重建技术领域,公开了一种基于姿态先验约束的启发式三维人体网格重建方法,本发明从特征图中提取综合先验约束向量,它将自我注意力集中在图像中人体的身体部分,避免了特征冗余。另外将骨架信息合并到一个互逆映射层中,增强模型修正人体网格姿态能力的同时保证了输入输出的语义一致性。此外,本发明提取的区域先验约束通过将交叉注意力指向顶点周围的关键点来微调局部顶点。然后,在微调过程中,利用启发式微调策略确定当前查询顶点的最优偏移量。和传统基于Transformer的方法相比,本发明所提出的启发式Transformer有效地减少了交叉注意力查询数量,在保证模型轻量级的同时加速模型的收敛速度。
-
公开(公告)号:CN113781376A
公开(公告)日:2021-12-10
申请号:CN202111085995.2
申请日:2021-09-16
Applicant: 浙江工业大学
Abstract: 本发明公开了一种基于分治融合的高清人脸属性编辑方法,属于计算机视觉领域。该方法提出了一个包含低清人脸编辑网络与高清人脸图像融合网络的人脸属性编辑框架。先对原始高分辨率图像进行下采样后得到低分辨率的人脸图像,在低清人脸编辑网络中对低分辨率的人脸图像进行属性编辑后上采样至原大小;在高清人脸图像融合网络中对原始高分辨率图像与上采样的人脸图像进行切片,利用双通道编码器编码,再与属性差值向量融合,之后在解码器中解码得到结果切片,最后按位置拼接得到高清人脸图像。本发明提出的高清人脸属性编辑方法被验证具有较高的图像生成效率且生成的图像具有较高质量。
-
公开(公告)号:CN119313575A
公开(公告)日:2025-01-14
申请号:CN202411239098.6
申请日:2024-09-05
Applicant: 浙江工业大学
IPC: G06T5/60 , G06T5/73 , G06T5/77 , G06N3/0455 , G06N3/0464
Abstract: 本发明公开了一种基于带不对称双分支解码器的U型网络的图像去雨雾方法,属于计算机视觉领域。该方法通过U型网络实现,其中U型网络包括单分支编码器和不对称双分支解码器。不对称双分支解码器由污染物残差分支和场景残差分支组成,前者用于提取雨、雾、雪等遮挡物的残差特征,后者用于恢复恶劣天气下受大气光影响的场景信息。该方法首先将带雨雾的原始图像输入单分支编码器,获得各卷积块的编码特征;然后通过不对称双分支解码器依次解码,恢复污染物和场景残差特征至与原始图像相同的尺寸。最终,通过将原始图像与恢复后的特征图像相减,得到去雨雾后的清晰图像。本发明能够高效去除图像中的污染物,并同时恢复场景的细节信息。
-
公开(公告)号:CN114463863A
公开(公告)日:2022-05-10
申请号:CN202111564707.1
申请日:2021-12-20
Applicant: 浙江工业大学
Abstract: 本发明公开了一种基于生成对抗网络的非可逆人脸信息加密及人脸识别方法,该方法基于人脸属性编辑,对人脸信息提取特征,采用非可逆加密人脸属性映射,得出加密后的数据值并编辑出一张相对应的新的人脸信息,通过比对加密后的人脸信息,识别判断得出结果。本发明可用于安检、支付、解锁、购票、比对、身份核验等需要人脸识别的应用场景平台,可使各应用平台中存储的人脸数据变为经过不可逆加密的人脸数据,保护了个人面部信息的隐私性。同时,通过在不同应用平台应用不同的加密参数,可实现不同应用平台人脸储存信息的独立性与安全性,体现出本发明的广泛应用性。本发明的实施,将有助于加强对人脸隐私信息的保护。
-
公开(公告)号:CN109345588B
公开(公告)日:2021-10-15
申请号:CN201811101406.3
申请日:2018-09-20
Applicant: 浙江工业大学
Abstract: 本发明公开了一种基于Tag的六自由度姿态估计方法,通过在物体上添加Tag来辅助检测,通过相机识别出物体上的Tag,帮助SLAM完成初始化,在初始化后,持续对每帧图像提取特征点,并根据上一帧对应的速度矩阵是否为空,进行相机位姿估计,以相机位姿估计得到的值为初值,采用特征点对应的地图点重投影到图像坐标系的重投影误差函数作为目标函数,进行相机位姿优化,得到优化好的相机位姿及特征点对应的地图点,再把相机的位姿转换成物体的位姿。本发明的方法在成像质量差以及物体高速运动时有较好的鲁棒性,并且有很高姿态估计精度。
-
公开(公告)号:CN106295509B
公开(公告)日:2019-11-08
申请号:CN201610597025.3
申请日:2016-07-27
Applicant: 浙江工业大学
Abstract: 一种面向非均匀退化视频中对象的结构化跟踪方法,在非均匀退化的目标视频中,利用自相关产生的方向图和Tenengrad提取的每个目标部分的退化程度结合在我们的基于超像素结构化模型,一个目标的一个未分配的干涉图是用来跟踪目标,图的节点是超像素中心点,边缘是超像素间的连线。本发明方法跟踪效果跟好,特别是在退化的视频目标跟踪中可以有效避免因为严重模糊导致的跟踪失败问题。
-
公开(公告)号:CN107527350A
公开(公告)日:2017-12-29
申请号:CN201710559875.9
申请日:2017-07-11
Applicant: 浙江工业大学
Abstract: 一种适用于视觉特征退化图像的固废对象分割方法,主要涉及于机器人视觉和图像分割等领域。由于视觉特征退化和固废物体存在粘连和遮挡情况,传统图像分割算法很难得到高精度的分割结果。本发明通过深度背景建模得到背景模型,比较背景模型和固废点云来提取前景mask。提取前景mask中的局部mask,将整张图像分割问题转换成了多个局部mask的分割问题。对于局部mask,通过模糊区域提取来分割粘连和遮挡物体,最后执行模糊区重标记来得到高精度的分割结果。本发明分割精度高,能够有效分割严重颜色退化的固废物体,并且对于粘连和遮挡的固废物体,分割效果也十分的理想。
-
公开(公告)号:CN113780209B
公开(公告)日:2024-02-02
申请号:CN202111085993.3
申请日:2021-09-16
Applicant: 浙江工业大学
IPC: G06V40/16 , G06V10/74 , G06N3/0455 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于注意力机制的人脸属性编辑方法,命名为DAGAN。该方法提出了一个基于注意力机制的传输单元,包括位置注意力模块和通道注意力模块;此外,该方法采用多尺度输入的方法,与编码器‑解码器相结合,同时提高了属性编辑能力和图像的生成质量。本发明所提出的对偶注意力机制的人脸属性编辑方法,极大地提升了编辑效率,在保证模型轻便的同时提高了属性编辑准确度。
-
-
-
-
-
-
-
-
-