基于强化学习的行为识别视频帧采样方法及系统

    公开(公告)号:CN109800717B

    公开(公告)日:2021-02-02

    申请号:CN201910060129.4

    申请日:2019-01-22

    Abstract: 本发明涉及一种基于强化学习的行为识别视频帧采样方法及系统,所述行为识别视频帧采样方法包括:从待测试视频提取待测视频帧序列,并从待测视频帧序列中均匀采样T帧待测图像;基于行为识别的基础模型及各帧待测图像,确定对应帧待测图像的待测特征向量和待测行为预测;针对每帧待测图像,将待测特征向量和待测行为预测级联,得到待测状态序列;根据基于长短时记忆网络的智能体及待测状态序列,确定每帧待测图像的待测重要性得分;按照待测重要性得分的大小,从各帧待测图像中选取多帧待测视频的关键帧;根据各关键帧的待测行为预测,得到待测视频的行为预测;根据待测视频的行为预测,确定识别结果,从而降低无关帧带来的负面影响,降低噪声。

    基于视觉注意机制强化学习弱监督图像检测方法、系统

    公开(公告)号:CN110084245A

    公开(公告)日:2019-08-02

    申请号:CN201910273048.2

    申请日:2019-04-04

    Inventor: 张兆翔 张驰 恩擎

    Abstract: 本发明属于计算机及机器学习领域,具体涉及了一种基于视觉注意机制强化学习弱监督图像检测方法、系统,旨在解决现有的图像检测方法需要大量有明确标签的训练数据,且标记费时费力的问题。本发明方法包括:获取具有弱监督标记的图像作为输入图像;采用特征提取网络提取输入图像的特征;依据对应的弱监督标记,计算并排序,获得排序后的自顶向下的特征表示;将其输入深度Q网络,计算擦除动作序列;将擦除动作序列作用于输入图像进行擦除操作,直到预设的停止动作,将获得的图像作为检测结果。本发明使用自顶向下的信息通过决策神经网络从动作空间中得到最优动作策略,能有效地模仿人类的视觉机理,通过迭代方式聚焦显著区域。

    目标体的动作行为识别方法及装置

    公开(公告)号:CN108629326A

    公开(公告)日:2018-10-09

    申请号:CN201810455262.5

    申请日:2018-05-14

    Abstract: 本发明属于计算机视觉技术领域,具体涉及一种目标体的动作行为识别方法及装置,旨在解决如何准确识别具有相似背景的视频中动作行为的技术问题。为此目的,本发明中目标体的动作行为识别方法包括:基于预先构建的行为识别模型,获取目标体的时序视频特征,并根据所获取的时序视频特征,预测每个预设的所述目标体的动作行为类别对应的类属概率;根据预测结果,确定目标体的动作行为类别。基于本发明的方法,可以很好地捕捉视频整体的特征,以此能够很好的识别出具有相似背景及易混淆的视频中动作行为。

    一种基于运动目标表象和运动信息的摄像机自标定方法

    公开(公告)号:CN101488222B

    公开(公告)日:2011-02-09

    申请号:CN200810056258.8

    申请日:2008-01-16

    Abstract: 本发明基于视频中运动目标表象和运动信息的摄像机自标定方法,对包含运动目标的视频进行前景检测,提取运动目标区域;对每一个运动目标区域提取特征;对运动目标区域进行粗略分类;从海量运动目标区域的表象和运动信息中,提取相互垂直的三个消失点;结合摄像机高度信息完成监控场景摄像机的完全标定。本发明替代手工标定的工作量和误差。用于基于图像或视频的测量,通过图像中的点距离获得三维世界的真实点距离,通过图像中的线夹角获得三维世界的真实线夹角。用于监控场景中的物体分类识别,补偿二维图像特征固有的透视变形。用于监控场景中的基于三维模型的物体识别,获得三维姿态和轨迹,有效帮助系统理解场景中发生的行为。

    一种基于运动目标表象和运动信息的摄像机自标定方法

    公开(公告)号:CN101488222A

    公开(公告)日:2009-07-22

    申请号:CN200810056258.8

    申请日:2008-01-16

    Abstract: 本发明基于视频中运动目标表象和运动信息的摄像机自标定方法,对包含运动目标的视频进行前景检测,提取运动目标区域;对每一个运动目标区域提取特征;对运动目标区域进行粗略分类;从海量运动目标区域的表象和运动信息中,提取相互垂直的三个消失点;结合摄像机高度信息完成监控场景摄像机的完全标定。本发明替代手工标定的工作量和误差。用于基于图像或视频的测量,通过图像中的点距离获得三维世界的真实点距离,通过图像中的线夹角获得三维世界的真实线夹角。用于监控场景中的物体分类识别,补偿二维图像特征固有的透视变形。用于监控场景中的基于三维模型的物体识别,获得三维姿态和轨迹,有效帮助系统理解场景中发生的行为。

    一种基于统计特征的人群密度分析方法

    公开(公告)号:CN101464944A

    公开(公告)日:2009-06-24

    申请号:CN200710179883.7

    申请日:2007-12-19

    Abstract: 本发明一种基于统计特征的人群密度分析方法,包括视频输入和帧抽取;从视频帧序列中提取马赛克图像差分MID特征,检测出人群中的细微的运动;检验赛克图像差分MID特征序列时间均匀分布;对具有明显透视现象的人群场景做几何校正,获得图像平面上每个像素对人群密度的贡献因子;对人群空间面积做加权处理,获得人群密度。该方法与现有方法相比,不需要参考背景,也不需要背景建模,能自适应早晚光线的变化,算法比较鲁棒,应用方便;数学模型简单有效,能准确定位人群的空间分布和大小,直观性强;计算量小,适合实时视觉监控。本发明能广泛地应用于公交、地铁和广场等滞留人群密集的公共场所的监控和管理。

Patent Agency Ranking