-
公开(公告)号:CN113158782B
公开(公告)日:2024-03-26
申请号:CN202110259862.6
申请日:2021-03-10
Applicant: 浙江工业大学
IPC: G06V20/52 , G06V10/25 , G06V10/44 , G06V10/80 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 一种基于单帧图像的多人并发交互行为理解方法,包括以下步骤:1)输入图片,结合骨架估计和多目标跟踪算法,获得人体骨架数据和感兴趣区域;2)使用人体骨架数据生成骨架部件置信度图和部件亲和力场,并构建注意力图;3)定义基于人体骨架注意力的Resnet‑Attention网络;4)定义多人交互行为理解的双流网络;5)网络参数训练。所提算法利用注意力图增强RGB图像的卷积网络特征,并基于人体骨架数据和移位图卷积网络提取双人交互特征,从而实现对单帧图像的多人交互行为建模,获得有效的交互行为表征。本发明适用于单帧图像中的多人并发交互理解。
-
公开(公告)号:CN110598523B
公开(公告)日:2021-10-26
申请号:CN201910659707.6
申请日:2019-07-22
Applicant: 浙江工业大学
Abstract: 一种服装图片的联合颜色分类与分组方法,在预先未知组别个数的情况下,所提算法利用完全图对不同图片之间的分组关系进行建模,通过融合从数据中学到的深度特征和丰富的上下文信息实现分组关系的充分表达,并提出了一种基于交替搜索思想的高效推理算法求解服装图片的分组结果。本发明能够融合深度学习特征和丰富的上下文特征进行联合分类与分组;实现分类与分组模型参数的有效训练;快速求解分类与分组的推理优化问题。
-
公开(公告)号:CN108846358B
公开(公告)日:2021-10-26
申请号:CN201810606690.3
申请日:2018-06-13
Applicant: 浙江工业大学
Abstract: 一种基于孪生网络进行特征融合的目标跟踪方法,包括孪生网络模型的训练过程和模型在目标跟踪场景中的应用;孪生网络模型的训练过程如下:步骤1.1:模型训练数据集的选取;步骤1.2:训练数据集的预处理;步骤1.3:模型的训练:输入步骤1.2预处理的训练集进行训练;步骤1.4:模型获取;模型在目标跟踪场景中的应用过程如下:步骤2.1:数据输入;步骤2.2:模板更新;步骤2.3:目标位置评估;步骤2.4:利用算法得到的评估位置,提取后续的图像对,将提取到的图像对作为模型的输入,输入到模型中,重复上述的步骤2.1‑2.4的过程,直到图像序列中所有图像都处理完为止。本发明提升鲁棒性,提升跟踪效果。
-
公开(公告)号:CN113158782A
公开(公告)日:2021-07-23
申请号:CN202110259862.6
申请日:2021-03-10
Applicant: 浙江工业大学
Abstract: 一种基于单帧图像的多人并发交互行为理解方法,包括以下步骤:1)输入图片,结合骨架估计和多目标跟踪算法,获得人体骨架数据和感兴趣区域;2)使用人体骨架数据生成骨架部件置信度图和部件亲和力场,并构建注意力图;3)定义基于人体骨架注意力的Resnet‑Attention网络;4)定义多人交互行为理解的双流网络;5)网络参数训练。所提算法利用注意力图增强RGB图像的卷积网络特征,并基于人体骨架数据和移位图卷积网络提取双人交互特征,从而实现对单帧图像的多人交互行为建模,获得有效的交互行为表征。本发明适用于单帧图像中的多人并发交互理解。
-
公开(公告)号:CN110276391A
公开(公告)日:2019-09-24
申请号:CN201910524579.4
申请日:2019-06-18
Applicant: 浙江工业大学
Abstract: 一种基于深度时空条件随机场的多人头部朝向估计方法,包括以下步骤:1)利用YOLO检测人体头部,并缩放为64x64大小的图像,然后将头部图像进行标准化处理;2)训练卷积网络提取头部朝向特征;3)提取头部HoG特征;4)将卷积特征和HoG特征拼接起来形成完整特征,然后基于整体特征训练线性SVM分类器,该分类器所输出的判别分数用于构建一个条件随机场模型;5)构建一个用于多人头部朝向联合识别的条件随机场模型。该条件随机场融合CNN特征、HoG特征以及多人场景的时空语义信息对多人头部朝向进行结构化建模,可以使得多人头部朝向识别的准确度得到显著提升。本发明适用于多人头部朝向的估计。
-
公开(公告)号:CN107491735A
公开(公告)日:2017-12-19
申请号:CN201710593912.8
申请日:2017-07-20
Applicant: 浙江工业大学
Abstract: 一种用于人类行为识别的标签和交互关系联合学习方法,包括以下步骤:1),使用CNN特征、HOG特征、HOF特征及人与人之间的距离、头部朝向等信息构造能量函数,包含一元能量项、二元能量项、交互能量项和正则化项;2)使用大间隔结构化学习训练所有模型参数;3)标签和交互关系预测,使用交替搜索策略求解复杂推理问题,在迭代中交替优化标签和交互结构。本发明适用于包含多人、多行为类别的图像和视频,能够同时识别个人行为和人与人之间的交互行为。
-
公开(公告)号:CN108305266B
公开(公告)日:2020-08-18
申请号:CN201711429655.0
申请日:2017-12-26
Applicant: 浙江工业大学
Abstract: 一种基于条件随机场图结构学习的语义图像分割的方法,所述方法包括以下步骤:1)训练一个全卷积神经网络或是采用现成的全卷积神经网络来进行语义图像粗分割;2)使用rcf神经网络学习条件随机场图结构;3)采用学习得到的图结构来训练条件随机场模型参数;使用训练得到的条件随机场模型做语义图像细分割,过程如下:解决最大后验MAP推理问题,通过调用alpha‑beta扩展例程来找到x的最优标签。本发明提供一种分割效果较好的基于条件随机场图结构学习的语义图像分割的方法。
-
公开(公告)号:CN107491735B
公开(公告)日:2020-08-18
申请号:CN201710593912.8
申请日:2017-07-20
Applicant: 浙江工业大学
Abstract: 一种用于人类行为识别的标签和交互关系联合学习方法,包括以下步骤:1),使用CNN特征、HOG特征、HOF特征及人与人之间的距离、头部朝向等信息构造能量函数,包含一元能量项、二元能量项、交互能量项和正则化项;2)使用大间隔结构化学习训练所有模型参数;3)标签和交互关系预测,使用交替搜索策略求解复杂推理问题,在迭代中交替优化标签和交互结构。本发明适用于包含多人、多行为类别的图像和视频,能够同时识别个人行为和人与人之间的交互行为。
-
公开(公告)号:CN108846358A
公开(公告)日:2018-11-20
申请号:CN201810606690.3
申请日:2018-06-13
Applicant: 浙江工业大学
Abstract: 一种基于孪生网络进行特征融合的目标跟踪方法,包括孪生网络模型的训练过程和模型在目标跟踪场景中的应用;孪生网络模型的训练过程如下:步骤1.1:模型训练数据集的选取;步骤1.2:训练数据集的预处理;步骤1.3:模型的训练:输入步骤1.2预处理的训练集进行训练;步骤1.4:模型获取;模型在目标跟踪场景中的应用过程如下:步骤2.1:数据输入;步骤2.2:模板更新;步骤2.3:目标位置评估;步骤2.4:利用算法得到的评估位置,提取后续的图像对,将提取到的图像对作为模型的输入,输入到模型中,重复上述的步骤2.1-2.4的过程,直到图像序列中所有图像都处理完为止。本发明提升鲁棒性,提升跟踪效果。
-
公开(公告)号:CN108305266A
公开(公告)日:2018-07-20
申请号:CN201711429655.0
申请日:2017-12-26
Applicant: 浙江工业大学
Abstract: 一种基于条件随机场图结构学习的语义图像分割的方法,所述方法包括以下步骤:1)训练一个全卷积神经网络或是采用现成的全卷积神经网络来进行语义图像粗分割;2)使用rcf神经网络学习条件随机场图结构;3)采用学习得到的图结构来训练条件随机场模型参数;使用训练得到的条件随机场模型做语义图像细分割,过程如下:解决最大后验MAP推理问题,通过调用alpha-beta扩展例程来找到x的最优标签。本发明提供一种分割效果较好的基于条件随机场图结构学习的语义图像分割的方法。
-
-
-
-
-
-
-
-
-