-
公开(公告)号:CN109614853B
公开(公告)日:2023-05-05
申请号:CN201811273872.X
申请日:2018-10-30
Applicant: 国家新闻出版广电总局广播科学研究院 , 北京邮电大学
IPC: G06N3/045 , G06N3/0464 , G06N3/082 , G06V10/82 , G06V40/10
Abstract: 本发明涉及一种基于身体结构划分的双线性行人再识别网络构建方法,包括以下步骤:对原始行人图像进行身体结构分块得到多个结构子框,将多个子框组合成新的行人图像,构造结构框预测子网络;设置加权的局部损失函数来训练该结构框预测子网络;构造两个子网络,分别以原始行人图像和重组后行人图像作为输入,对应地提取全局行人特征和局部行人特征;设置双线性融合层,并将其作为全局特征和局部特征的融合层,得到最终的行人特征表示;对整体网络进行训练,得到基于身体结构划分的双线性行人再识别模型。本发明结合整体特征和局部特征,充分利用了身体结构信息,通过双线性融合方法获得更具判别力的行人特征,使得系统整体匹配准确率大大提升。
-
公开(公告)号:CN107563381B
公开(公告)日:2020-10-23
申请号:CN201710816619.3
申请日:2017-09-12
Applicant: 国家新闻出版广电总局广播科学研究院 , 北京邮电大学
Abstract: 本发明设计了一种基于全卷积网络的多特征融合的目标检测方法,其主要技术特点是:搭建具有六个卷积层组的全卷积神经网络;利用卷积神经网络的前五组卷积层提取图像特征,并将其输出进行融合,形成融合特征图;对融合后的特征图进行卷积处理,直接产生固定数目的不同大小的目标边框;计算卷积神经网络生成的目标边框与真实边框之间的分类误差与定位误差,利用随机梯度下降法降低训练误差,得到最终训练模型的参数,最后进行测试得到目标检测结果。本发明利用了深度卷积网络对目标的强大的表示能力,构建了用于目标检测的全卷积神经网络,提出了新的融合特征方法,提高了算法的检测速度和精度,获得了良好的目标检测结果。
-
公开(公告)号:CN105491370B
公开(公告)日:2020-09-22
申请号:CN201510799543.9
申请日:2015-11-19
Applicant: 国家新闻出版广电总局广播科学研究院
Abstract: 本发明涉及一种基于图的协同低高级特征的视频显著性检测方法,属于视频检测技术领域,其技术特点是:使用改进的随机行走算法模拟人眼运动进行视频显著性检测。该方法从视频流中提取低级特征与高级特征,以超像素为基本单元,利用低级特征获得空域转移概率矩阵和时域重启矩阵,以边界优先作为一种高级特征获得基于边界先验的的重启矩阵。将两种重启矩阵与空域转移概率矩阵相结合到重启性随机行走算法的框架中获得时空域显著性图。本文将算法在两个公开数据库上进行了测试,实验结果表明该方法优于其它显著性检测算法。本发明设计合理,利用低级特征和高级特征构建重启性随机行走的框架,获得了与人眼注意机制高度相符的显著性检测结果。
-
公开(公告)号:CN106204647B
公开(公告)日:2019-05-10
申请号:CN201610515653.2
申请日:2016-07-01
Applicant: 国家新闻出版广电总局广播科学研究院
IPC: G06T7/246
Abstract: 本发明专利涉及一种基于多特征和组稀疏的视觉目标跟踪方法,其技术特点是:在视频当前帧中对目标进行多特征提取;利用多特征信息构造不同特征下的学习字典;在新视频帧中进行粒子采样;采用边界粒子重采样以去除不合格的粒子,然后对剩下的粒子求解稀疏优化方程;更新模板并考察本帧结果和最大系数模板的余弦相似度,如果相似度低于某一个值,则用当前模板替换系数最小的模板;若视频未结束,则重采样。本发明融合了多特征、粒子滤波、组稀疏学习技术,其通过跟踪物体的多种特征使得构造的字典中含有更丰富的目标信息,增加了整体算法的跟踪精度,提高了跟踪结果的稳定性,获得了很好的视觉目标跟踪结果。
-
公开(公告)号:CN107729993A
公开(公告)日:2018-02-23
申请号:CN201711033085.3
申请日:2017-10-30
Applicant: 国家新闻出版广电总局广播科学研究院 , 北京邮电大学
IPC: G06N3/04
CPC classification number: G06N3/0454
Abstract: 本发明涉及一种利用训练样本及折中度量的3D卷积神经网络构建方法,其技术特点是:构造孪生结构的3D卷积神经网络;设置网络的损失函数,该损失函数由正样本损失、负样本损失及正则化损失构成,并在正则化损失中结合了马氏距离和欧氏距离;使用softmax损失函数,使用视频序列形式的数据集对网络进行预训练;构造正样本对和负样本对,对图像进行预处理和分割;有选择地利用训练样本对网络进行训练。本发明设计合理,其有选择地使用训练样本来提高训练效率并抑制过拟合,同时,在对特征进行度量时对欧氏距离和马氏距离进行权衡,从而构建3D卷积神经网络模型,试验表明本发明构建的模型及训练策略使得系统整体匹配率大大提升。
-
公开(公告)号:CN106127766A
公开(公告)日:2016-11-16
申请号:CN201610467214.9
申请日:2016-06-24
Applicant: 国家新闻出版广电总局广播科学研究院
IPC: G06T7/00
CPC classification number: G06T2207/20081
Abstract: 本发明涉及一种基于空间耦合关系和历史模型的目标跟踪方法,其主要技术特点是:建立MIL模型并在跟踪过程中不断更新该MIL模型;利用跟踪目标的历史状态构成一个目标模型池;针对当前帧选择最佳的目标模型并估计目标位置;检测目标周边区域的关键点,利用空间相关信息预测目标位置;融合利用最佳模型估计出的目标位置和利用空间相关信息预测出的目标位置,得到最终的目标位置。本发明设计合理,以多示例学习跟踪算法为基本的跟踪模型,保存一组目标历史模型,配合空间上下文信息辅助跟踪,达到了出色的跟踪效果,能够应对各种环境变化的情况,具有良好的鲁棒性和较强的可扩展性。
-
公开(公告)号:CN107679461A
公开(公告)日:2018-02-09
申请号:CN201710816499.7
申请日:2017-09-12
Applicant: 国家新闻出版广电总局广播科学研究院 , 北京邮电大学
Abstract: 本发明设计了一种基于对偶综合-解析字典学习的行人再识别方法,其主要技术特点是:从行人再识别数据中提取行人图像特征;采用局部Fisher判决分析方法将不同摄像机视角下的行人图像特征投影到公共特征空间;运用对偶综合-解析字典学习算法,在公共特征空间中学习对偶综合字典和对偶解析字典;建立行人匹配模型,并利用改进余弦公式进行行人距离计算。本发明设计合理,其通过在原始对偶综合字典学习中引入对偶解析字典,解析字典拥有判决能力,提高了综合字典的数据表示能力,使得字典能够更有效的表示数据的本征结构,获得了有效的再识别性能。
-
公开(公告)号:CN107292914A
公开(公告)日:2017-10-24
申请号:CN201710450318.3
申请日:2017-06-15
Applicant: 国家新闻出版广电总局广播科学研究院 , 北京邮电大学
Abstract: 本发明涉及一种基于小型单支卷积神经网络的视觉目标跟踪方法,其主要技术特点是:搭建小型单支卷积神经网络;设计损失函数用于卷积神经网络的训练;对测试序列进行目标跟踪,当新视频帧到来时,根据损失函数的结果判断网络参数的更新与否;将卷积神经网络的输出结果送给二元分类器,预测出目标位置。本发明利用了深度卷积网络对目标物体强大的表示能力,构建小型单支卷积神经网络,提出新的损失函数和更新策略,增加了整体算法的跟踪精度,提高了跟踪结果的稳定性以及跟踪速率,获得了很好的目标跟踪结果。
-
公开(公告)号:CN106203450A
公开(公告)日:2016-12-07
申请号:CN201610542676.2
申请日:2016-07-11
Applicant: 国家新闻出版广电总局广播科学研究院
CPC classification number: G06K9/4604 , G06K9/42 , G06K9/6269 , G06K2209/21
Abstract: 本发明涉及一种基于深度学习框架对图像进行特征提取的目标检测方法,其技术特点是:基于MCG算法对图像进行预处理,提取出可能存在的目标位置的图像块;基于MTSE算法优化已提取出来的图像块;将得到的图像块利用超像素优化的方法迭代调整到caffe框架输入要求的大小;利用caffe深度学习框架对图像块进行特征提取,其中模型的配置利用R-CNN算法完成;对得到的特征利用SVM算法进行分类,得到最终结果。本发明设计合理,通过对图像进行预处理减少了特征的计算量,然后利用caffe深度学习框架提取图像的深度特征,能更好地表示物体,并用SVM分类算法对特征进行分类,获得了良好的检测结果。
-
公开(公告)号:CN105491370A
公开(公告)日:2016-04-13
申请号:CN201510799543.9
申请日:2015-11-19
Applicant: 国家新闻出版广电总局广播科学研究院
Abstract: 本发明涉及一种基于图的协同低高级特征的视频显著性检测方法,属于视频检测技术领域,其技术特点是:使用改进的随机行走算法模拟人眼运动进行视频显著性检测。该方法从视频流中提取低级特征与高级特征,以超像素为基本单元,利用低级特征获得空域转移概率矩阵和时域重启矩阵,以边界优先作为一种高级特征获得基于边界先验的重启矩阵。将两种重启矩阵与空域转移概率矩阵相结合到重启性随机行走算法的框架中获得时空域显著性图。本文将算法在两个公开数据库上进行了测试,实验结果表明该方法优于其它显著性检测算法。本发明设计合理,利用低级特征和高级特征构建重启性随机行走的框架,获得了与人眼注意机制高度相符的显著性检测结果。
-
-
-
-
-
-
-
-
-