-
公开(公告)号:CN117237840A
公开(公告)日:2023-12-15
申请号:CN202311160733.7
申请日:2023-09-08
Applicant: 北京理工大学
IPC: G06V20/40 , G06V10/80 , G06V10/82 , G06V10/774
Abstract: 本发明公开的一种基于未来特征自监督学习的流式感知方法,属于计算机视觉领域。本发明实现方法为:构建未来特征自监督学习的流式感知模型,流式感知模型简称为FFSSL模型。FFSSL模型包括StreamYOLO子模型、YOLOX子模型、自监督模块。利用未来帧的外观特征来增强流式感知的性能,提高FFSSL模型对时间序列数据中连续性和时序变化的捕获能力,确保预测的连续性和准确性;此外,本发明结合StreamYOLO和YOLOX的特点,实现对视频序列中每帧数据的深度解析,得到更丰富、更多样的特征表示,通过对历史、当前和未来帧进行综合分析,保证模型在每一步都能充分地利用每帧的信息,通过自监督的学习策略,有效地整合目标在不同时间点的特征,实现对目标的高精度、高稳定性预测。
-
公开(公告)号:CN119206189A
公开(公告)日:2024-12-27
申请号:CN202411363799.0
申请日:2024-09-28
Applicant: 北京理工大学
Abstract: 本发明涉及一种基于光流引导的实时目标检测流式感知方法,包括:提取连续两帧图像的多尺度特征;计算连续两帧图像的光流场;根据当前帧的目标检测结果,选择所述光流场中的目标周围邻域的光流信息;利用所述多尺度特征和选择的光流信息进行位置预测;对预测的位置进行优化,获取最终的目标检测结果。本发明提高了对UAV视频中快速移动物体的检测精度和实时性能。
-