基于数据组合和通道相关性的动作视频分类方法和装置

    公开(公告)号:CN115082840B

    公开(公告)日:2022-11-15

    申请号:CN202210980779.2

    申请日:2022-08-16

    Abstract: 本发明公开了基于数据组合和通道相关性的动作视频分类方法和装置,包括以下步骤:步骤S1:从输入视频中提取连续采样视频帧;步骤S2:利用数据组合操作构建融合视频帧;步骤S3:利用所提出的网络模型提取视频深度特征;步骤S4:利用视频深度特征计算通道相关性矩阵;步骤S5:将通道相关性矩阵作用于视频深度特征并进行特征融合,得到融合后特征;步骤S6:所述融合后特征经过全连接层进行分类,再通过均匀融合得到输入视频的分类结果。本发明通过数据组合操作将相邻视频帧信息进行融合,从而巧妙利用视频中的2D空域卷积实现了短时运动建模。此外本发明通过计算各特征通道之间的相关性,实现了各通道之间的信息交互,达到了更好地建模效果。

    基于两阶段运动建模和注意力的动作视频分类方法和系统

    公开(公告)号:CN115063731B

    公开(公告)日:2022-11-11

    申请号:CN202210980577.8

    申请日:2022-08-16

    Abstract: 本发明公开了一种基于两阶段运动建模和注意力的动作视频分类方法和系统,包括以下步骤:步骤S1:构建采样帧输入至主干网络;步骤S2:第一阶段段内运动信息建模,输出包含短时运动信息的视频卷积特征;步骤S3:第二阶段段间运动信息建模,输出融合了短时运动信息和长时运动信息的空间块注意力视频卷积特征;步骤S4:经过全连接层后得到各视频段的分类结果并融合,训练网络。本发明利用卷积神经网络的多层次结构,在网络的较低层和较高层分别提取段内运动信息和段间运动信息,达到分阶段运动综合建模的目的。此外,本发明计算视频卷积特征各空间块之间的注意力关系,使得网络同时具备了卷积操作和注意力机制的短距离和长距离建模能力。

    基于数据组合和通道相关性的动作视频分类方法和装置

    公开(公告)号:CN115082840A

    公开(公告)日:2022-09-20

    申请号:CN202210980779.2

    申请日:2022-08-16

    Abstract: 本发明公开了基于数据组合和通道相关性的动作视频分类方法和装置,包括以下步骤:步骤S1:从输入视频中提取连续采样视频帧;步骤S2:利用数据组合操作构建融合视频帧;步骤S3:利用所提出的网络模型提取视频深度特征;步骤S4:利用视频深度特征计算通道相关性矩阵;步骤S5:将通道相关性矩阵作用于视频深度特征并进行特征融合,得到融合后特征;步骤S6:所述融合后特征经过全连接层进行分类,再通过均匀融合得到输入视频的分类结果。本发明通过数据组合操作将相邻视频帧信息进行融合,从而巧妙利用视频中的2D空域卷积实现了短时运动建模。此外本发明通过计算各特征通道之间的相关性,实现了各通道之间的信息交互,达到了更好地建模效果。

    基于双流多分辨率综合建模的动作视频分类方法和系统

    公开(公告)号:CN115063732A

    公开(公告)日:2022-09-16

    申请号:CN202210980578.2

    申请日:2022-08-16

    Abstract: 本发明公开了基于双流多分辨率综合建模的动作视频分类方法和系统,包括以下步骤:步骤S1:从视频样本中构建高分辨率稀疏采样帧和低分辨率稠密采样帧两种网络输入;步骤S2:所提出的双流多分辨率建模网络包含两个分支,分别处理这两种输入;步骤S3:利用侧边连接进行特征融合,得到融合后的空域卷积特征;步骤S4:两个分支得到的视频卷积特征分别经过2D池化操作和3D池化操作进行时空对齐,并在加权融合后输入全连接层,得到各视频段的预测结果;步骤S5:将各视频段的预测结果均匀融合得到原始视频的分类结果,进行网络训练。本发明基于时空多层次建模思想,分别构建两种网络输入,这两种输入包含互补的空域表观和时域运动信息,且降低运算开销。

    基于双流多分辨率综合建模的动作视频分类方法和系统

    公开(公告)号:CN115063732B

    公开(公告)日:2022-11-11

    申请号:CN202210980578.2

    申请日:2022-08-16

    Abstract: 本发明公开了基于双流多分辨率综合建模的动作视频分类方法和系统,包括以下步骤:步骤S1:从视频样本中构建高分辨率稀疏采样帧和低分辨率稠密采样帧两种网络输入;步骤S2:所提出的双流多分辨率建模网络包含两个分支,分别处理这两种输入;步骤S3:利用侧边连接进行特征融合,得到融合后的空域卷积特征;步骤S4:两个分支得到的视频卷积特征分别经过2D池化操作和3D池化操作进行时空对齐,并在加权融合后输入全连接层,得到各视频段的预测结果;步骤S5:将各视频段的预测结果均匀融合得到原始视频的分类结果,进行网络训练。本发明基于时空多层次建模思想,分别构建两种网络输入,这两种输入包含互补的空域表观和时域运动信息,且降低运算开销。

    基于两阶段运动建模和注意力的动作视频分类方法和系统

    公开(公告)号:CN115063731A

    公开(公告)日:2022-09-16

    申请号:CN202210980577.8

    申请日:2022-08-16

    Abstract: 本发明公开了一种基于两阶段运动建模和注意力的动作视频分类方法和系统,包括以下步骤:步骤S1:构建采样帧输入至主干网络;步骤S2:第一阶段段内运动信息建模,输出包含短时运动信息的视频卷积特征;步骤S3:第二阶段段间运动信息建模,输出融合了短时运动信息和长时运动信息的空间块注意力视频卷积特征;步骤S4:经过全连接层后得到各视频段的分类结果并融合,训练网络。本发明利用卷积神经网络的多层次结构,在网络的较低层和较高层分别提取段内运动信息和段间运动信息,达到分阶段运动综合建模的目的。此外,本发明计算视频卷积特征各空间块之间的注意力关系,使得网络同时具备了卷积操作和注意力机制的短距离和长距离建模能力。

Patent Agency Ranking