-
公开(公告)号:CN111898608B
公开(公告)日:2022-04-26
申请号:CN202010636379.0
申请日:2020-07-04
Applicant: 西北工业大学
Abstract: 本发明公开了一种基于边界预测的自然场景多语言文字检测方法,首先构建了一个多语言文字检测网络模型,该模型包括特征提取主干网络、残差卷积模块(RCM)、残差池化模块(RPM)和特征融合层,对输入图像逐像素预测文字区域与其外接边界,并将其转化为置信图输出,通过广度优先搜索算法将边界相连的文字区域分离进而得到最终的检测结果。本方法能够检测任意方向、形状的多语言文字区域,降低了算法复杂度,节省计算时间,显著提升了检测精度。
-
公开(公告)号:CN111898608A
公开(公告)日:2020-11-06
申请号:CN202010636379.0
申请日:2020-07-04
Applicant: 西北工业大学
Abstract: 本发明公开了一种基于边界预测的自然场景多语言文字检测方法,首先构建了一个多语言文字检测网络模型,该模型包括特征提取主干网络、残差卷积模块(RCM)、残差池化模块(RPM)和特征融合层,对输入图像逐像素预测文字区域与其外接边界,并将其转化为置信图输出,通过广度优先搜索算法将边界相连的文字区域分离进而得到最终的检测结果。本方法能够检测任意方向、形状的多语言文字区域,降低了算法复杂度,节省计算时间,显著提升了检测精度。
-
公开(公告)号:CN109800757B
公开(公告)日:2022-04-19
申请号:CN201910006843.5
申请日:2019-01-04
Applicant: 西北工业大学
Abstract: 为了解决大幅度相机移动下的多文字追踪,本发明提出了一种基于布局约束的视频文字追踪方法。该方法的输入为视频和视频帧的文字检测结果,输出为文字追踪后的轨迹信息。首先,通过初始视频帧的检测结果进行文字轨迹的初始化,然后将上一帧的文字轨迹与当前帧的检测结果送入本发明的追踪方法中进行文字轨迹的更新。文字轨迹更新的核心是将当前帧检测到的文字区域对应到已有的文字轨迹,该过程可以视为一种数据匹配问题。本发明针对此问题设计一个新的数据匹配代价函数,通过求解代价函数的得到最佳匹配结果。经过重复轨迹更新过程直到视频处理结束,最终得到文字追踪结果。本发明在数据匹配代价函数中引入布局约束,通过文字区域间的整体外观结构进行文字追踪,可以有效避免因为相机大幅度运动导致错误追踪结果,具有更好的追踪效果。
-
公开(公告)号:CN111210907A
公开(公告)日:2020-05-29
申请号:CN202010034752.5
申请日:2020-01-14
Applicant: 西北工业大学
Abstract: 本发明提出了一种基于空时注意力机制的疼痛强度估计方法。首先将人脸图像映射到预训练模型VGG-16中得到一个深度特征图谱,将该特征图谱输入到空间注意力模块中得到空间注意力图谱,并将空间注意力图谱作用到深度特征图谱上得到空间注意力特征。然后,将空间注意力特征提取网络固定,每幅图像生成相应的空间注意力特征,将该特征输入到循环神经网络中,后接时间注意力模块,生成时间注意力特征,并利用该特征估计视频序列的疼痛强度。本发明通过引入空时注意力机制,在提取空时疼痛特征的同时,更加关注人脸上和疼痛最为相关的区域以及视频序列中具有疼痛强度的图像帧,从而有效提升疼痛强度估计效果。
-
公开(公告)号:CN109800757A
公开(公告)日:2019-05-24
申请号:CN201910006843.5
申请日:2019-01-04
Applicant: 西北工业大学
IPC: G06K9/32
Abstract: 为了解决大幅度相机移动下的多文字追踪,本发明提出了一种基于布局约束的视频文字追踪方法。该方法的输入为视频和视频帧的文字检测结果,输出为文字追踪后的轨迹信息。首先,通过初始视频帧的检测结果进行文字轨迹的初始化,然后将上一帧的文字轨迹与当前帧的检测结果送入本发明的追踪方法中进行文字轨迹的更新。文字轨迹更新的核心是将当前帧检测到的文字区域对应到已有的文字轨迹,该过程可以视为一种数据匹配问题。本发明针对此问题设计一个新的数据匹配代价函数,通过求解代价函数的得到最佳匹配结果。经过重复轨迹更新过程直到视频处理结束,最终得到文字追踪结果。本发明在数据匹配代价函数中引入布局约束,通过文字区域间的整体外观结构进行文字追踪,可以有效避免因为相机大幅度运动导致错误追踪结果,具有更好的追踪效果。
-
-
-
-