-
公开(公告)号:CN119832480A
公开(公告)日:2025-04-15
申请号:CN202510043748.8
申请日:2025-01-10
Applicant: 广东工业大学
IPC: G06V20/40 , G06V10/46 , G06N3/045 , G06V10/82 , G06N3/0442 , G06N3/0464 , G06V10/80
Abstract: 本发明提供了一种基于时空上下文场景关系传播的视频显著性物体检测方法,涉及视频显著性物体检测的技术领域。首先,对视频帧序列中每一帧视频进行场景解析,获得每一帧视频对应的实例级对象。接着,提取每一帧视频及其对应的实例级对象的全局实例级特征、局部实例级特征及帧内低级特征。然后,从相同的视频帧序列中随机采样任一帧视频的匹配帧,提取匹配帧全局实例级特征,将全局实例级特征整合到匹配帧全局实例级特征中,得到视频帧间的时间特征;使用密集空间注意机制将局部实例级特征集成到全局实例级特征,得到空间特征。将时间特征和空间特征进行特征拼接,得到时空特征。将时空特征和全局实例级特征输入到基于门控循环单元的卷积神经网络中进行更新,得到高级时空特征。最后,将帧内低级特征和高级时空特征进行特征融合后解码,生成视频显著性物体掩码检测结果。本发明利用了视频中丰富的帧间和帧内场景关系信息,提高了在复杂场景中视频显著性物体检测的准确率。