一种基于布局约束的视频文字追踪方法

    公开(公告)号:CN109800757B

    公开(公告)日:2022-04-19

    申请号:CN201910006843.5

    申请日:2019-01-04

    Abstract: 为了解决大幅度相机移动下的多文字追踪,本发明提出了一种基于布局约束的视频文字追踪方法。该方法的输入为视频和视频帧的文字检测结果,输出为文字追踪后的轨迹信息。首先,通过初始视频帧的检测结果进行文字轨迹的初始化,然后将上一帧的文字轨迹与当前帧的检测结果送入本发明的追踪方法中进行文字轨迹的更新。文字轨迹更新的核心是将当前帧检测到的文字区域对应到已有的文字轨迹,该过程可以视为一种数据匹配问题。本发明针对此问题设计一个新的数据匹配代价函数,通过求解代价函数的得到最佳匹配结果。经过重复轨迹更新过程直到视频处理结束,最终得到文字追踪结果。本发明在数据匹配代价函数中引入布局约束,通过文字区域间的整体外观结构进行文字追踪,可以有效避免因为相机大幅度运动导致错误追踪结果,具有更好的追踪效果。

    一种基于空时注意力机制的疼痛强度估计方法

    公开(公告)号:CN111210907A

    公开(公告)日:2020-05-29

    申请号:CN202010034752.5

    申请日:2020-01-14

    Abstract: 本发明提出了一种基于空时注意力机制的疼痛强度估计方法。首先将人脸图像映射到预训练模型VGG-16中得到一个深度特征图谱,将该特征图谱输入到空间注意力模块中得到空间注意力图谱,并将空间注意力图谱作用到深度特征图谱上得到空间注意力特征。然后,将空间注意力特征提取网络固定,每幅图像生成相应的空间注意力特征,将该特征输入到循环神经网络中,后接时间注意力模块,生成时间注意力特征,并利用该特征估计视频序列的疼痛强度。本发明通过引入空时注意力机制,在提取空时疼痛特征的同时,更加关注人脸上和疼痛最为相关的区域以及视频序列中具有疼痛强度的图像帧,从而有效提升疼痛强度估计效果。

    一种基于布局约束的视频文字追踪方法

    公开(公告)号:CN109800757A

    公开(公告)日:2019-05-24

    申请号:CN201910006843.5

    申请日:2019-01-04

    Abstract: 为了解决大幅度相机移动下的多文字追踪,本发明提出了一种基于布局约束的视频文字追踪方法。该方法的输入为视频和视频帧的文字检测结果,输出为文字追踪后的轨迹信息。首先,通过初始视频帧的检测结果进行文字轨迹的初始化,然后将上一帧的文字轨迹与当前帧的检测结果送入本发明的追踪方法中进行文字轨迹的更新。文字轨迹更新的核心是将当前帧检测到的文字区域对应到已有的文字轨迹,该过程可以视为一种数据匹配问题。本发明针对此问题设计一个新的数据匹配代价函数,通过求解代价函数的得到最佳匹配结果。经过重复轨迹更新过程直到视频处理结束,最终得到文字追踪结果。本发明在数据匹配代价函数中引入布局约束,通过文字区域间的整体外观结构进行文字追踪,可以有效避免因为相机大幅度运动导致错误追踪结果,具有更好的追踪效果。

Patent Agency Ranking