-
公开(公告)号:CN116246196A
公开(公告)日:2023-06-09
申请号:CN202211602297.X
申请日:2022-12-14
IPC: G06V20/40 , G06T7/11 , G06V10/764 , G06V10/82 , G06N3/08 , G06N3/0464
Abstract: 本发明属于计算机视觉技术领域,具体为一种利用像素级时空特征记忆库的视频目标跟踪方法。本发明方法包括:剪裁动态目标图像和搜索区域图像、提取图像特征、像素级在线预测、像素级更新策略“融合‑替换”、特征增强与像素级匹配和头部网络结构实现目标跟踪等步骤。本发明在输入目标在初始帧的初始框后,通过高效地利用记忆库,节约存储资源和计算资源,能有效应对目标在视频中的外观变化等场景,具备很高的自适应性和鲁棒性。同时,本方法对于现阶段流行的卷积神经网络模型和Transformer模型均可实现快速部署。本方法适用于在计算机辅助视频分析场景下,自动生成任意目标在视频中的包围框并跟踪,可用于安防监控分析、自动驾驶、人机交互等。