基于深度学习框架对图像进行特征提取的目标检测方法

    公开(公告)号:CN106203450A

    公开(公告)日:2016-12-07

    申请号:CN201610542676.2

    申请日:2016-07-11

    Inventor: 赵怀瑾 周芸 王强

    CPC classification number: G06K9/4604 G06K9/42 G06K9/6269 G06K2209/21

    Abstract: 本发明涉及一种基于深度学习框架对图像进行特征提取的目标检测方法,其技术特点是:基于MCG算法对图像进行预处理,提取出可能存在的目标位置的图像块;基于MTSE算法优化已提取出来的图像块;将得到的图像块利用超像素优化的方法迭代调整到caffe框架输入要求的大小;利用caffe深度学习框架对图像块进行特征提取,其中模型的配置利用R-CNN算法完成;对得到的特征利用SVM算法进行分类,得到最终结果。本发明设计合理,通过对图像进行预处理减少了特征的计算量,然后利用caffe深度学习框架提取图像的深度特征,能更好地表示物体,并用SVM分类算法对特征进行分类,获得了良好的检测结果。

    基于图的协同低高级特征的视频显著性检测方法

    公开(公告)号:CN105491370A

    公开(公告)日:2016-04-13

    申请号:CN201510799543.9

    申请日:2015-11-19

    Abstract: 本发明涉及一种基于图的协同低高级特征的视频显著性检测方法,属于视频检测技术领域,其技术特点是:使用改进的随机行走算法模拟人眼运动进行视频显著性检测。该方法从视频流中提取低级特征与高级特征,以超像素为基本单元,利用低级特征获得空域转移概率矩阵和时域重启矩阵,以边界优先作为一种高级特征获得基于边界先验的重启矩阵。将两种重启矩阵与空域转移概率矩阵相结合到重启性随机行走算法的框架中获得时空域显著性图。本文将算法在两个公开数据库上进行了测试,实验结果表明该方法优于其它显著性检测算法。本发明设计合理,利用低级特征和高级特征构建重启性随机行走的框架,获得了与人眼注意机制高度相符的显著性检测结果。

    基于空间耦合关系和历史模型的目标跟踪方法

    公开(公告)号:CN106127766B

    公开(公告)日:2018-12-25

    申请号:CN201610467214.9

    申请日:2016-06-24

    Inventor: 何珂 王强 周芸

    Abstract: 本发明涉及一种基于空间耦合关系和历史模型的目标跟踪方法,其主要技术特点是:建立MIL模型并在跟踪过程中不断更新该MIL模型;利用跟踪目标的历史状态构成一个目标模型池;针对当前帧选择最佳的目标模型并估计目标位置;检测目标周边区域的关键点,利用空间相关信息预测目标位置;融合利用最佳模型估计出的目标位置和利用空间相关信息预测出的目标位置,得到最终的目标位置。本发明设计合理,以多示例学习跟踪算法为基本的跟踪模型,保存一组目标历史模型,配合空间上下文信息辅助跟踪,达到了出色的跟踪效果,能够应对各种环境变化的情况,具有良好的鲁棒性和较强的可扩展性。

    基于多特征和组稀疏的视觉目标跟踪方法

    公开(公告)号:CN106204647A

    公开(公告)日:2016-12-07

    申请号:CN201610515653.2

    申请日:2016-07-01

    Abstract: 本发明专利涉及一种基于多特征和组稀疏的视觉目标跟踪方法,其技术特点是:在视频当前帧中对目标进行多特征提取;利用多特征信息构造不同特征下的学习字典;在新视频帧中进行粒子采样;采用边界粒子重采样以去除不合格的粒子,然后对剩下的粒子求解稀疏优化方程;更新模板并考察本帧结果和最大系数模板的余弦相似度,如果相似度低于某一个值,则用当前模板替换系数最小的模板;若视频未结束,则重采样。本发明融合了多特征、粒子滤波、组稀疏学习技术,其通过跟踪物体的多种特征使得构造的字典中含有更丰富的目标信息,增加了整体算法的跟踪精度,提高了跟踪结果的稳定性,获得了很好的视觉目标跟踪结果。

    基于梯度幅值相似性的色调映射图像质量评价方法

    公开(公告)号:CN105491371A

    公开(公告)日:2016-04-13

    申请号:CN201510800435.9

    申请日:2015-11-19

    Abstract: 本发明提出了一种基于梯度幅值相似性的色调映射图像质量评价方法,属于图像处理领域。本发明提出的方法包括步骤:1)计算高动态图像和色调映射器转换之后的色调映射图像的梯度图;2)对高动态图像和色调映射图像所对应的梯度图进行基于人类视觉系统的动态范围调整;3)计算梯度图对之间的相似性,并以色调映射幅值大小作为权值;4)利用对比度、亮度和细节表述计算色调映射图像的自然性值;5)将相似性值和自然性值进行合并。本发明设计合理,其采用能够有效捕捉到图像失真的梯度幅度相似性特征,并且结合了图像的自然性特征(图像看起来必须自然)能够有效地对色调映射图像的质量进行评价,提高了评价性能。

    基于生成式对抗网络模型的数据增强行人再识别方法

    公开(公告)号:CN110188835A

    公开(公告)日:2019-08-30

    申请号:CN201910483958.3

    申请日:2019-06-05

    Abstract: 本发明涉及一种基于生成式对抗网络模型的数据增强行人再识别方法,包括使用Mask-RCNN图像分割算法分割出图像中行人的掩膜图像;结合掩膜图像和手工标注行人属性,训练一个端到端的改进星形生成式对抗网络,从一个摄像头下的真实行人图像生成任何数量摄像头下的假训练图像;使用训练好的改进星形生成式对抗网络生成所有真实图像对应的所有相机域的假训练图像;将真实图像和假训练图像一起送入行人再识别模型,计算行人图像间距离并完成行人再识别功能。本发明设计合理,利用生成式对抗网络生成更多的训练样本,同时生成的图像背景能够有效地表示相对应摄像头下的真实场景,有效提高行人再识别模型的鲁棒性和判决能力,有效提高了行人再识别的准确率。

    基于恰可察感知质量判决准则的HEVC率失真优化算法

    公开(公告)号:CN104219526B

    公开(公告)日:2017-05-24

    申请号:CN201410440120.3

    申请日:2014-09-01

    Abstract: 本发明涉及一种基于恰可察感知质量判决准则的HEVC率失真优化算法,其技术特点是:分析每一帧中每个宏块的运动模式及静态纹理特征,获得当前宏块的感知质量类型,得到图像显著区域;计算基于视觉显著性区域的恰可察失真阈值;计算基于恰可察失真模型的感知质量;根据基于恰可察失真模型的感知质量进行率失真优化。本发明设计合理,其采用基于恰可察感知质量判决准则进行HEVC率失真优化,能够克服均方误差MSE作为衡量视频失真评价标准的不足,使得最终的编码效果更加符合人眼的主观感知质量,同时,在主观质量不降低的前提下容忍更多的噪声,去除不必要的感知冗余,从而提高了压缩效率,降低了编码后文件的码率。

    基于生成式对抗网络模型的数据增强行人再识别方法

    公开(公告)号:CN110188835B

    公开(公告)日:2021-03-16

    申请号:CN201910483958.3

    申请日:2019-06-05

    Abstract: 本发明涉及一种基于生成式对抗网络模型的数据增强行人再识别方法,包括使用Mask‑RCNN图像分割算法分割出图像中行人的掩膜图像;结合掩膜图像和手工标注行人属性,训练一个端到端的改进星形生成式对抗网络,从一个摄像头下的真实行人图像生成任何数量摄像头下的假训练图像;使用训练好的改进星形生成式对抗网络生成所有真实图像对应的所有相机域的假训练图像;将真实图像和假训练图像一起送入行人再识别模型,计算行人图像间距离并完成行人再识别功能。本发明设计合理,利用生成式对抗网络生成更多的训练样本,同时生成的图像背景能够有效地表示相对应摄像头下的真实场景,有效提高行人再识别模型的鲁棒性和判决能力,有效提高了行人再识别的准确率。

    基于恰可察感知质量判决准则的HEVC率失真优化算法

    公开(公告)号:CN104219526A

    公开(公告)日:2014-12-17

    申请号:CN201410440120.3

    申请日:2014-09-01

    Abstract: 本发明涉及一种基于恰可察感知质量判决准则的HEVC率失真优化算法,其技术特点是:分析每一帧中每个宏块的运动模式及静态纹理特征,获得当前宏块的感知质量类型,得到图像显著区域;计算基于视觉显著性区域的恰可察失真阈值;计算基于恰可察失真模型的感知质量;根据基于恰可察失真模型的感知质量进行率失真优化。本发明设计合理,其采用基于恰可察感知质量判决准则进行HEVC率失真优化,能够克服均方误差MSE作为衡量视频失真评价标准的不足,使得最终的编码效果更加符合人眼的主观感知质量,同时,在主观质量不降低的前提下容忍更多的噪声,去除不必要的感知冗余,从而提高了压缩效率,降低了编码后文件的码率。

Patent Agency Ranking