一种基于帧差卷积神经网络的视频重点区域分析方法

    公开(公告)号:CN118609015A

    公开(公告)日:2024-09-06

    申请号:CN202410644380.6

    申请日:2024-05-23

    Abstract: 本发明公开了一种基于帧差卷积神经网络的视频重点区域分析方法,包括:利用SVM分类器对每个视频帧进行分类,确定视频帧所属类别;基于卷积神经网络和LSTM网络构建场景类别识别模型,用于对视频帧进行场景类别标记;根据场景类别设计热力图提取方案,对输入的图像数组数据生成灰度图作为热度权重;根据视频帧所属类别,利用热力图与加权矩阵相乘得到的结果,获取权值最大的区域作为截取部分的中心点;根据计算出的截取部分的中心点坐标对视频帧进行裁剪,将处理后的竖屏画面在前端进行显示。本发明能够准确地进行视频的裁剪,最后在前端显示出裁剪后视频画面的重点部分,提供更好的竖屏观看体验。

Patent Agency Ranking