-
公开(公告)号:CN120014225A
公开(公告)日:2025-05-16
申请号:CN202411991666.8
申请日:2024-12-31
Applicant: 北京工业大学
IPC: G06V10/24 , G06V10/40 , G06V10/774 , G06V10/80 , G06N3/0455 , G06N3/0464
Abstract: 本发明公开了一种基于双螺旋卷积注意力金字塔的视频时序动作定位方法,具体如下:首先,利用预训练的特征提取器从输入视频中提取特征;其次,利用时空特征优化器通过时间维度降采样,同时在通道维度上进行升采样以增强特征表示,并为多尺度双螺旋注意力卷积模块和双螺旋特征金字塔网络提供处理后的特征;然后,利用多尺度双螺旋注意力卷积模块建立特征序列之间的关联,并通过自适应学习将其整合到注意力机制的输出中;最后,双螺旋特征金字塔网络通过横向特征融合与纵向特征迭代交替进行,以获得多尺度视频表示,并将多尺度特征送入到分类头和回归头中得到最终的定位结果。本发明能够更准确地对未剪辑的视频中存在的动作进行分类和定位。
-
公开(公告)号:CN120014436A
公开(公告)日:2025-05-16
申请号:CN202411991662.X
申请日:2024-12-31
Applicant: 北京工业大学
IPC: G06V20/10 , G06V10/40 , G06V10/764 , G06V10/80 , G06V10/74 , G06N3/0464
Abstract: 本发明公开了一种基于遥感图像的旋转目标检测方法,属于计算机视觉领域。首先,利用由目标姿态引导特征提取模块所组成的特征提取主干,提取RGB遥感图像的细粒度特征,得到一系列在空间分辨率和通道数上各不相同的特征图序列;随后,选取这些特征图序列的后三层特征,通过增强路径特征金字塔网络对特征的上下文信息进行聚合,并弥补在聚合过程中自下而上路径中的特征损失;最后,特征细化模块通过引入注意力机制,对拼接后的特征进行加权重构与优化,得到聚合后的多尺度细粒度特征,并将聚合后的多尺度细粒度特征送入分类头和回归头中,得到最终的目标检测结果。本发明在主流遥感图像的旋转目标检测方法中达到了极具竞争力的精准度。
-