-
公开(公告)号:CN117854112A
公开(公告)日:2024-04-09
申请号:CN202410054481.8
申请日:2024-01-15
Applicant: 北京工业大学
Abstract: 本发明公开一种基于自适应遮蔽的三维人体姿态估计方法,以单目无标注图像为输入估计人体的姿态和外形参数,通过多尺度的遮挡训练能够适应室外各种复杂的遮挡情况,且得到更加稳定且准确的姿态估计。本发明提出了一个全局重优化模块,利用全局特征作为人体的高级语义表征,来完善仅由局部特征预测出的人体姿态,这种局部特征和全局特征的结合,同时也确保了对遮挡区域回归的鲁棒性。从总体结果来看,本发明在遮挡条件下达到了最先进的人体姿态和外形估计的表现。所提出的人体姿态估计方法能有效提高实际部署场景下的人体估计精度,尤其在复杂的遮蔽环境中能够进行稳定的部署。
-
公开(公告)号:CN120014225A
公开(公告)日:2025-05-16
申请号:CN202411991666.8
申请日:2024-12-31
Applicant: 北京工业大学
IPC: G06V10/24 , G06V10/40 , G06V10/774 , G06V10/80 , G06N3/0455 , G06N3/0464
Abstract: 本发明公开了一种基于双螺旋卷积注意力金字塔的视频时序动作定位方法,具体如下:首先,利用预训练的特征提取器从输入视频中提取特征;其次,利用时空特征优化器通过时间维度降采样,同时在通道维度上进行升采样以增强特征表示,并为多尺度双螺旋注意力卷积模块和双螺旋特征金字塔网络提供处理后的特征;然后,利用多尺度双螺旋注意力卷积模块建立特征序列之间的关联,并通过自适应学习将其整合到注意力机制的输出中;最后,双螺旋特征金字塔网络通过横向特征融合与纵向特征迭代交替进行,以获得多尺度视频表示,并将多尺度特征送入到分类头和回归头中得到最终的定位结果。本发明能够更准确地对未剪辑的视频中存在的动作进行分类和定位。
-
公开(公告)号:CN120014436A
公开(公告)日:2025-05-16
申请号:CN202411991662.X
申请日:2024-12-31
Applicant: 北京工业大学
IPC: G06V20/10 , G06V10/40 , G06V10/764 , G06V10/80 , G06V10/74 , G06N3/0464
Abstract: 本发明公开了一种基于遥感图像的旋转目标检测方法,属于计算机视觉领域。首先,利用由目标姿态引导特征提取模块所组成的特征提取主干,提取RGB遥感图像的细粒度特征,得到一系列在空间分辨率和通道数上各不相同的特征图序列;随后,选取这些特征图序列的后三层特征,通过增强路径特征金字塔网络对特征的上下文信息进行聚合,并弥补在聚合过程中自下而上路径中的特征损失;最后,特征细化模块通过引入注意力机制,对拼接后的特征进行加权重构与优化,得到聚合后的多尺度细粒度特征,并将聚合后的多尺度细粒度特征送入分类头和回归头中,得到最终的目标检测结果。本发明在主流遥感图像的旋转目标检测方法中达到了极具竞争力的精准度。
-
-