-
公开(公告)号:CN118747905A
公开(公告)日:2024-10-08
申请号:CN202410741638.4
申请日:2024-06-09
Applicant: 北京航空航天大学 , 杭州海康威视数字技术股份有限公司
IPC: G06V40/10 , G06V10/44 , G06N3/0464 , G06V10/80 , G06N3/0895 , G06V10/764
Abstract: 行人属性识别(PAR)旨在生成行人的结构化描述,并在监控中具有重要意义。现有方法主要致力于训练过程中提升属性的空间定位。然而,这些方法未能解决数据集中单一视角姿态与现实中遇到的复杂视角姿态之间的差异,导致在开放环境中属性定位效果不佳。因此,本文介绍了一种新的多视角PAR方法,该方法使用人体关键点信息来适应复杂视角姿态。该方法利用关键点来建模属性特征的空间分布,便于进行弱监督定位,以模拟属性与人体在复杂视角下的动态关系。此外,它还结合了空间位置编码来建模人体结构信息,并隐式捕捉属性与人体之间的关系。最后我们应用了特征融合的方法使得空间位置信息发挥更大的作用。
-
公开(公告)号:CN117115851A
公开(公告)日:2023-11-24
申请号:CN202310608449.5
申请日:2023-05-27
Applicant: 北京航空航天大学 , 杭州海康威视数字技术股份有限公司
IPC: G06V40/10 , G06V20/52 , G06V10/82 , G06N3/0464 , G06N3/084
Abstract: 一种在监控场景下,基于去除深度模型在推理过程中学习到的冗余属性间共现偏置,以实现在变化场景下更好泛化性能的行人属性识别方法。包括:一种新的属性信息解耦特征的生成方式。在模型对某一属性的识别和推理过程中,利用特征的线性插值与标签的线性插值匹配这一先前研究中的实验观察,通过最小化该属性的特化特征与其他属性预测概率间的互信息,以减少对于其他属性信息的利用,在显著降低训练时间的前提下实现了更好的准确率;一种新的特征插值方法。本发明提出了方向‑范数分离的特征插值方法,该方法相比于原始的插值过程,可以更好地发掘与探索属性特征的分布域,进而提高了模型的最终效果;使用卷积神经网络,按照以上算法框架,以特定训练参数配置对模型进行训练,得到行人属性识别模型。本方法可以实现在发生时空变化的监控场景中更加精确和稳定的行人属性识别结果。
-
公开(公告)号:CN115862071A
公开(公告)日:2023-03-28
申请号:CN202211616862.8
申请日:2022-12-15
Applicant: 北京航空航天大学
IPC: G06V40/10 , G06V10/46 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明提供一种基于朝向感知的行人属性表示与学习方法,其中,该方法包括以下步骤:(A)以Swin Transformer神经网络提取图像特征,将特征图与特征部位进行关联,并将特征图转化为与属性具有强关联的属性特征向量;(B)根据(A)生成的属性特征向量,采用MEBOW模块,生成行人的朝向矢量;(C)根据(A)生成的属性特征向量,采用GradCAM方法生成所述行人结构化描述的类激活图,并根据(B)生成的行人的朝向矢量,采用LSTM模块计算空间注意力修正子;(D)根据(A)生成的属性特征向量,以self‑attention的方式计算并存储一个表征注意力分布的二维矩阵,并根据(B)生成的行人的朝向矢量,生成每个朝向的关系矩阵;(E)根据关系矩阵和属性特征向量,以图卷积的形式充分利用关系矩阵,进行属性推理预测;(F)将测试集输入到行人属性识别模型中进行识别,对实验结果进行评估。
-
公开(公告)号:CN119942184A
公开(公告)日:2025-05-06
申请号:CN202411957280.5
申请日:2024-12-30
Applicant: 北京航空航天大学
IPC: G06V10/764 , G06V10/82 , G06V10/40 , G06V10/44 , G06V10/774 , G06N3/045 , G06N3/0464 , G06N3/0455 , G06N3/084 , G06N5/04 , G06N3/048
Abstract: 本发明公开了一种基于信心分数协同优化的开放环境目标属性识别方法,旨在解决复杂且不断变化的开放环境中的模型泛化能力弱的问题。该方法包括以下关键步骤:(A)在模型训练步骤,通过最小化同一属性标签下正负样本的logit分数方差来学习对应的logit分数期望。(B)同时,通过约束同一属性标签下正负样本的logit分数期望关于0对称,确保产生的logit分数期望是无偏且平衡的。(C)在模型推理步骤,本发明将模型原始输出的属性标签logit分数减去在模型训练步骤学习到的该属性标签下正负样本的logit分数期望的均值,得到调整后的logit分数作为最终的logit分数输出。通过上述方法,本发明能够在时空变化的开放环境中实现更为准确和稳定的图像多标签属性识别。
-
-
-