一种复杂场景下实时视频多人行为识别方法及系统

    公开(公告)号:CN113963315B

    公开(公告)日:2025-02-11

    申请号:CN202111357367.5

    申请日:2021-11-16

    Abstract: 本发明涉及一种复杂场景下实时视频多人行为识别方法及系统,属于机器视觉技术领域。该方法包括:采集视频数据;建立场景人脸标签库,用于人脸识别模型训练;构建轻量化SlowFast模型用于复杂场景多人行为识别;建立不同人员类别异常行为动作标签库,建立训练行为动作标签库;将训练数据集经过预处理之后,输入到构建的轻量化SlowFast网络中进行训练;利用人脸识别模型和轻量化SlowFast网络模型进行实际场景行为动作检测、识别。本发明通过人脸识别,确定人员类别身份,建立人脸检测框与人员位置定位框的关联关系,对场景中目标人员的行为动作进行检测和识别,以实现在复杂场景中不同类别人员异常行为的监测和预警。

    一种复杂场景下实时视频多人行为识别方法及系统

    公开(公告)号:CN113963315A

    公开(公告)日:2022-01-21

    申请号:CN202111357367.5

    申请日:2021-11-16

    Abstract: 本发明涉及一种复杂场景下实时视频多人行为识别方法及系统,属于机器视觉技术领域。该方法包括:采集视频数据;建立场景人脸标签库,用于人脸识别模型训练;构建轻量化SlowFast模型用于复杂场景多人行为识别;建立不同人员类别异常行为动作标签库,建立训练行为动作标签库;将训练数据集经过预处理之后,输入到构建的轻量化SlowFast网络中进行训练;利用人脸识别模型和轻量化SlowFast网络模型进行实际场景行为动作检测、识别。本发明通过人脸识别,确定人员类别身份,建立人脸检测框与人员位置定位框的关联关系,对场景中目标人员的行为动作进行检测和识别,以实现在复杂场景中不同类别人员异常行为的监测和预警。

    基于Transformer网络模型的行人重识别方法、装置及计算机设备

    公开(公告)号:CN116311379B

    公开(公告)日:2025-04-29

    申请号:CN202310351000.5

    申请日:2023-04-04

    Abstract: 本发明属于计算机视觉领域,涉及一种基于Transformer网络模型的行人重识别方法、装置及计算机设备;所述方法包括获取目标行人图像并预处理,生成标准行人图像;将标准行人图像采用滑动窗口划分为多个具有重叠部分的方形子图像;对各方形子图像经过水平线性投影和垂直线性投影,得到水平特征矩阵和垂直特征矩阵;将其输入到预先训练好的改进Transformer网络模型中,预测得到目标行人图像的识别结果。本发明利用滑动窗口将输入图像划分为多个有重叠部分的正方形小块,突出了遮挡物与行人交界边缘处行人的特征;利用改进的Transformer网络结构,加强了行人特征在各个方向上的关联,提高了行人重识别准确度。

    基于Transformer网络模型的行人重识别方法、装置及计算机设备

    公开(公告)号:CN116311379A

    公开(公告)日:2023-06-23

    申请号:CN202310351000.5

    申请日:2023-04-04

    Abstract: 本发明属于计算机视觉领域,涉及一种基于Transformer网络模型的行人重识别方法、装置及计算机设备;所述方法包括获取目标行人图像并预处理,生成标准行人图像;将标准行人图像采用滑动窗口划分为多个具有重叠部分的方形子图像;对各方形子图像经过水平线性投影和垂直线性投影,得到水平特征矩阵和垂直特征矩阵;将其输入到预先训练好的改进Transformer网络模型中,预测得到目标行人图像的识别结果。本发明利用滑动窗口将输入图像划分为多个有重叠部分的正方形小块,突出了遮挡物与行人交界边缘处行人的特征;利用改进的Transformer网络结构,加强了行人特征在各个方向上的关联,提高了行人重识别准确度。

    融合全局和局部特征的行人重识别方法、存储器及处理器

    公开(公告)号:CN113269070A

    公开(公告)日:2021-08-17

    申请号:CN202110539959.2

    申请日:2021-05-18

    Abstract: 本发明涉及一种融合全局和局部特征的行人重识别方法、模型训练方法、可读存储介质及处理器,属于计算机视觉领域,包括以下步骤:S1:输入待识别的图像,将其预处理得到标准输入图像;S2:通过卷积神经网络来分别提取输入图像的全局特征和局部特征;S3:将全局特征和局部特征分别输入批量归一化层与1×1卷积层对特征进行降维;S4:将全局特征和局部特征进行融合,得到融合后的行人特征;S5:计算融合特征与图像库中各图像对应特征的距离,用于表示图像间的相似度;将图像库中的图像按照与输入图像的相似度排序,将排序结果作为行人重识别模型的输出。

Patent Agency Ranking