一种基于人体部件学习和姿态重构的视频行人重识别方法

    公开(公告)号:CN113807189B

    公开(公告)日:2023-10-27

    申请号:CN202110959958.3

    申请日:2021-08-20

    Inventor: 于慧敏 李殊昭

    Abstract: 本发明涉及智能识别技术领域,旨在提供一种基于人体部件学习和姿态重构的视频行人重识别方法。包括:构建用于训练的特征提取网络;生成人体姿态图序列,参照第一帧人体姿态图对人体姿态图序列和行人图像序列中每一帧图像进行对齐;对人体姿态图序列进行编码和重构;将对齐后的视频序列提取行人序列外观特征;将输出的运动特征和行人序列外观特征进行拼接,得到行人图像序列的身份特征表达。本发明充分利用了人体的特殊构造方式,即包含多个固定的人体关键点用于行人身份特征学习。通过挖掘人体局部外观特征和步态运动特征,能有效提升行人目标重识别模型的鲁棒性和性能。

    一种基于人体部件学习和姿态重构的视频行人重识别方法

    公开(公告)号:CN113807189A

    公开(公告)日:2021-12-17

    申请号:CN202110959958.3

    申请日:2021-08-20

    Inventor: 于慧敏 李殊昭

    Abstract: 本发明涉及智能识别技术领域,旨在提供一种基于人体部件学习和姿态重构的视频行人重识别方法。包括:构建用于训练的特征提取网络;生成人体姿态图序列,参照第一帧人体姿态图对人体姿态图序列和行人图像序列中每一帧图像进行对齐;对人体姿态图序列进行编码和重构;将对齐后的视频序列提取行人序列外观特征;将输出的运动特征和行人序列外观特征进行拼接,得到行人图像序列的身份特征表达。本发明充分利用了人体的特殊构造方式,即包含多个固定的人体关键点用于行人身份特征学习。通过挖掘人体局部外观特征和步态运动特征,能有效提升行人目标重识别模型的鲁棒性和性能。

    一种基于特征分离的缺陷检测方法

    公开(公告)号:CN118469899A

    公开(公告)日:2024-08-09

    申请号:CN202410374037.4

    申请日:2024-03-29

    Applicant: 浙江大学

    Inventor: 宋书懿 于慧敏

    Abstract: 本发明公开了一种缺陷检测和缺陷样本复原的方法。本方法包含训练和测试两个部分,训练为无监督训练。整体框架分为两个模块,一个是特征提取模块En,一个是解码器模块Dec。训练阶段将原始图像人为处理添加缺陷并输入En,En输出缺陷特征和样本固有特征,Dec将上述特征解码得到缺陷置信图和修复图像。在测试阶段输入图像不做缺陷添加处理直接输入En。De‑Trans模型相比于传统ViT加入了多class token机制以及相应的特征分离loss和全局位置编码模块,前者完成特征分离,后者显著加速模型的训练过程。本发明从特征分离层面完成无监督的缺陷检测和样本复原,有效的降低了缺陷检测的训练成本并显著地提高了缺陷定位的颗粒度和空间变化的鲁棒性。

    一种人眼虹膜检测方法和装置

    公开(公告)号:CN111079676B

    公开(公告)日:2022-07-19

    申请号:CN201911336374.X

    申请日:2019-12-23

    Applicant: 浙江大学

    Inventor: 于慧敏 丁洋凯

    Abstract: 本发明公开了一种人眼虹膜检测方法和装置,包括:接收人脸数据集,训练关键点定位神经网络;使用关键点定位神经网络进行人脸关键点的粗定位,获取相应的人脸关键点,根据得到的人脸关键点,选取人眼区域关键点;根据人眼区域关键点计算虹膜未被眼皮遮挡的角度大小以及人眼虹膜外边界半径大小上界;根据虹膜未被眼皮遮挡的角度大小以及人眼虹膜外边界半径大小上界,对所述人眼区域关键点进行迭代优化,实现关键点的精定位以及虹膜外边界的精定位。本发明能够高效定位人眼关键点的精定位以及虹膜外边界,精确性和鲁棒性较高,并且能达到实时处理的效率。

    一种三阶段图像质量评估的检测方法与系统

    公开(公告)号:CN114219803A

    公开(公告)日:2022-03-22

    申请号:CN202210156902.9

    申请日:2022-02-21

    Abstract: 本发明公开了一种三阶段图像质量评估的检测方法与系统。该方法对道路监控图片或视频建模,输出所关注目标的类别,位置信息和对应的图像质量。具体而言,在第一阶段中,将图像或视频帧作为输入,通过目标检测器输出所关注的目标特征及其位置信息;在第二阶段中,将第一阶段输出的目标特征及其位置信息通过部件检测器选择匹配输出目标部件特征和位置信息。在第三阶段中,将第二阶段输出的目标部件特征和位置信息通过图像质量评估分类器输出图像所关注区域质量等级。该方法在快速检测关注的目标基础上,结合部件信息,能够准确输出对应的图像区域质量等级。

    一种基于多帧注意力的自监督深度估计方法

    公开(公告)号:CN113240722A

    公开(公告)日:2021-08-10

    申请号:CN202110462631.5

    申请日:2021-04-28

    Applicant: 浙江大学

    Abstract: 本发明实例提供了一种基于多帧注意力的自监督深度估计方法。其中分为深度估计网络和相机姿态估计网络两路网络分别估计目标帧的深度以及预测相机运动。在相机姿态估计网络通过自注意力模块进行特征增强,预测相机运动;在深度估计网络通过多帧注意力模块给目标帧特征补充相邻帧信息,然后利用融合模块融合目标帧特征以及相机姿态估计网络中的相机姿态特征,进行目标帧的深度估计;最后利用深度估计网络预测的目标帧的深度和相机姿态估计网络预测的相机运动,用相邻帧来重建目标帧,并使用光度重建损失来约束重建帧和目标帧之间的一致性。本发明不仅可以大幅提高深度估计的各项精度,还能提高算法对于深度估计的时域一致性。

    基于数据风格解耦内容迁移的行人重识别数据域适应方法

    公开(公告)号:CN112633071A

    公开(公告)日:2021-04-09

    申请号:CN202011369468.X

    申请日:2020-11-30

    Abstract: 本发明属于智能识别技术领域,涉及基于数据风格解耦内容迁移的行人重识别数据域适应方法,包括:步骤一,构建用于训练的数据风格解耦网络;步骤二,利用源域和目标域数据进行内容迁移;步骤三,利用源域和目标域数据,合成样本特征以及对应的标签对内容特征提取器CE进行训练;步骤四,训练完成后,仅保留内容特征提取器CE作为测试用特征提取网络。本发明利用风格迁移模型实现了对不同数据域图片的风格解耦,获得具有数据域不变性的共享内容特征空间,并在共享内容特征空间内进行内容迁移,深入挖掘了源域与目标域数据之间的差异进行迁移适应,在测试应用中仅保留内容特征提取器,网络规模小,模型复杂度低,易于在实际应用场景部署。

    一种基于神经网络的轮廓演化分割方法

    公开(公告)号:CN111161280A

    公开(公告)日:2020-05-15

    申请号:CN201911310194.4

    申请日:2019-12-18

    Applicant: 浙江大学

    Inventor: 于慧敏 黄伟

    Abstract: 本发明实施例公开了一种基于神经网络的轮廓演化以及分割方法。该方法使用神经网络来自主自动地表达轮廓演化方向,将其应用于图像分割任务。本方法将轮廓演化分割过程阐释为一个给定初始化的增量更新过程,并使用神经网络来表达演化方向。相比于传统的主动轮廓分割模型和方法需要人工设定能量函数与演化方向,基于神经网络的轮廓演化可从数据和当前轮廓中自动学习和估计轮廓的演化方向。这种表达方法能够适应不同的初始轮廓,也克服了传统主动轮廓分割模型对于初始化轮廓非常敏感的问题。同时,由于本方法基于神经网络,因此估计演化方向的网络能够根据需要自行拓展以适应不同的分割任务场景。

    一种人眼虹膜检测方法和装置

    公开(公告)号:CN111079676A

    公开(公告)日:2020-04-28

    申请号:CN201911336374.X

    申请日:2019-12-23

    Applicant: 浙江大学

    Inventor: 于慧敏 丁洋凯

    Abstract: 本发明公开了一种人眼虹膜检测方法和装置,包括:接收人脸数据集,训练关键点定位神经网络;使用关键点定位神经网络进行人脸关键点的粗定位,获取相应的人脸关键点,根据得到的人脸关键点,选取人眼区域关键点;根据人眼区域关键点计算虹膜未被眼皮遮挡的角度大小以及人眼虹膜外边界半径大小上界;根据虹膜未被眼皮遮挡的角度大小以及人眼虹膜外边界半径大小上界,对所述人眼区域关键点进行迭代优化,实现关键点的精定位以及虹膜外边界的精定位。本发明能够高效定位人眼关键点的精定位以及虹膜外边界,精确性和鲁棒性较高,并且能达到实时处理的效率。

    一种基于超像素和结构化约束的图像多目标协同分割方法

    公开(公告)号:CN105809672B

    公开(公告)日:2019-09-13

    申请号:CN201610120407.7

    申请日:2016-03-03

    Applicant: 浙江大学

    Abstract: 本发明公开了一种非监督的基于超像素与结构化约束的图像多目标协同分割方法。针对一组包含有共同物体的多幅图片数据集,且每幅图片可能包含有多个共同物体,该方法能够准确地分割出共同物体。首先,该方法对输入的图像集进行预分割操作,得到过分割后的图像;然后,基于目标发现机制对所有的超像素进行前景和背景的分类,学习得到前背景分类器;最后,基于分类器得到的结果,对前景目标进行建模,利用森林模型假设与树图约束采用组合优化的算法完成对目标的精确分割。与同类算法相比,本发明通过提出新的森林模型假设与求解方法,通过树图的约束优化组合优化算法并提高分割精度,能够适应各种复杂场景。

Patent Agency Ranking