-
公开(公告)号:CN111241996B
公开(公告)日:2023-06-02
申请号:CN202010021860.9
申请日:2020-01-09
Applicant: 桂林电子科技大学
IPC: G06V40/20 , G06V40/10 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 本发明公开了一种用于识别视频中人物动作的方法,该方法是先利用一个空间卷积网络和时间卷积网络分别提取短视频中每一帧的空间特征和时间特征,对空间特征进行初步学习;然后利用运算模块对空间特征进行细粒度的学习,使用注意力机制选择空间特征中权重较大的特征向量生成注意力分数,用逐元素乘法生成的结果作为注意力特征向量,然后再以生成的结果作为空间特征向量,与时间特征作为输入,利用注意力继续选择空间特征中权重较大的特征向量,与时间特征做逐元素乘法,生成注意力特征向量,最后进行分类。该方法全部使用卷积核为1的空间和时间卷积,减少参数规模,实现降维,提高网络性能。与以往的网络相比,具有较高的准确率。
-
公开(公告)号:CN111241996A
公开(公告)日:2020-06-05
申请号:CN202010021860.9
申请日:2020-01-09
Applicant: 桂林电子科技大学
Abstract: 本发明公开了一种用于识别视频中人物动作的方法,该方法是先利用一个空间卷积网络和时间卷积网络分别提取短视频中每一帧的空间特征和时间特征,对空间特征进行初步学习;然后利用运算模块对空间特征进行细粒度的学习,使用注意力机制选择空间特征中权重较大的特征向量生成注意力分数,用逐元素乘法生成的结果作为注意力特征向量,然后再以生成的结果作为空间特征向量,与时间特征作为输入,利用注意力继续选择空间特征中权重较大的特征向量,与时间特征做逐元素乘法,生成注意力特征向量,最后进行分类。该方法全部使用卷积核为1的空间和时间卷积,减少参数规模,实现降维,提高网络性能。与以往的网络相比,具有较高的准确率。
-