-
公开(公告)号:CN112949544A
公开(公告)日:2021-06-11
申请号:CN202110285908.1
申请日:2021-03-17
Applicant: 上海大学
Abstract: 本发明涉及一种基于3D卷积网络的动作时序检测方法,通过K‑均值聚类提取动作发生显著变化的关键帧,利用3D卷积网络提取动作特征,再将3D卷积反卷积网络与时空特征金字塔结构融合实现多尺度动作帧级别预测,再用卡尔曼滤波对预测结果进行融合以达到预测动作时序的目的。本发明方法对发生在任意位置且具有任意时长的动作进行帧级别的预测,达到了实时性的效果;通过K‑均值聚类最大化动作关键帧之间的信息差异,使3D卷积网络能更为有效地提取到丰富的动作特征信息,提高了分类准确率;3D卷积反卷积网络和时空特征金字塔网络的多尺度融合方案,克服了单一尺度下预测精度不高的问题,预测结果兼具动作整体和动作细节信息,检测精度得到了显著提升。