-
公开(公告)号:CN107527355A
公开(公告)日:2017-12-29
申请号:CN201710595279.6
申请日:2017-07-20
Applicant: 中国科学院自动化研究所
CPC classification number: G06T7/223 , G06N3/04 , G06T2207/10016 , G06T2207/20021 , G06T2207/20081 , G06T2207/20084
Abstract: 本发明涉及计算机视觉领域,提出了一种基于卷积神经网络回归模型的视觉跟踪方法、装置,旨在解决目标跟踪过程被分成部件匹配、目标定位两个独立的步骤,不能做到直接从部件推断目标的位置的问题,该方法包括:S1,在视觉跟踪的初始帧,根据给定的待跟踪目标进行图像块的采样,并划分为多个部件;S2,利用随机梯度下降法对预先构建的基于卷积神经网络回归模型进行训练;S3,在视觉跟踪的后续各帧中,基于所述待跟踪目标在上一帧中出现的位置构造搜索区域,通过所述训练好的基于卷积神经网络回归模型得到当前帧中所述待跟踪目标的位置。本发明将部件与目标定位进行了充分结合,具有较好的鲁棒性。
-
公开(公告)号:CN106875426A
公开(公告)日:2017-06-20
申请号:CN201710094496.7
申请日:2017-02-21
Applicant: 中国科学院自动化研究所
IPC: G06T7/277
Abstract: 本发明公开了一种基于相关粒子滤波的视觉跟踪方法及装置,该方法包括:根据上一时刻的粒子状态和粒子权重在当前时刻生成粒子并进行重采样;对当前时刻重采样得到的每个粒子进行混合相关滤波使其移动并到达一个稳定的位置;使用混合相关滤波响应更新所述每个粒子的权重并更新进行混合相关滤波的相关滤波器的参数;根据更新后的粒子权重对每个粒子状态进行加权从而获得被跟踪目标在当前帧的跟踪状态。
-
公开(公告)号:CN103455705A
公开(公告)日:2013-12-18
申请号:CN201310197129.1
申请日:2013-05-24
Applicant: 中国科学院自动化研究所
IPC: G06F19/00
Abstract: 本发明是一种网络社会事件的协同关联跟踪及全局态势分析与预测系统,该系统具有:信息融合单元,对网络社会事件数据的多模态特性进行融合,用于获得社会事件的多模态数据的融合信息,构建跨社会事件的多模态数据的语义描述模型;跟踪单元与信息融合单元连接,基于跨社会事件的多模态数据语义描述模型,面对包含丰富多媒体信息的网络内容,针对网络社会事件具有的跨模态属性、跨平台属性和跨时空属性,获得社会事件在各个属性上的语义关联跟踪数据;分析与预测单元与跟踪单元连接,基于语义关联跟踪数据,获得基于社会事件的全局态势分析与预测数据。
-
公开(公告)号:CN102054176A
公开(公告)日:2011-05-11
申请号:CN201010603240.2
申请日:2010-12-23
Applicant: 中国科学院自动化研究所
Abstract: 本发明用计算机对运动目标的场景图像建立语义场景模型的方法,包括步骤S1:利用图像处理设备输入的视频数据,得到待处理的运动目标图像数据,进行目标检测和跟踪;步骤S2:基于协同训练方法学习行人和车的分类器,减少训练标注样本和充分利用目标的多种特征;根据学习得到的分类器,将目标分为行人和车辆;步骤S3:对于每类目标的轨迹进行轨迹聚类,得到目标的轨迹聚类;步骤S4:根据目标的轨迹聚类,得到每种轨迹的分布区域,并且利用均值漂移算法得到每种轨迹分布区域的主要轨迹和轨迹的入点和出点,从而得到有一定语义的区域和实现应用。
-
公开(公告)号:CN106874365A
公开(公告)日:2017-06-20
申请号:CN201611260200.6
申请日:2016-12-30
Applicant: 中国科学院自动化研究所
CPC classification number: G06F16/2465 , G06F16/285 , G06Q50/01
Abstract: 本发明公开一种基于社会媒体平台上社会事件的跟踪方法。其中,该方法包括提取社会媒体平台上社会事件的文本和视觉信息特征;基于提取的文本和视觉信息特征,利用基于事件的在线多模态跟踪方法,在线地建模多模态数据的社会事件,得到多模态的文本和视觉主题以及社会事件文档的特征表示;利用多模态的文本和视觉主题以及社会事件文档的特征表示,并将基于事件的在线多模态跟踪方法集成到社会事件跟踪方法上,来进行社会事件跟踪。由此,本发明实施例能够针对时序性的社会事件进行有效地跟踪,且有效地跟踪整个事件过程的发展轨迹,并且让用户快速了解和分析整个事件的演变过程,从而改善了跟踪效果,实现了基于多模态信息语义融合的社会事件跟踪。
-
公开(公告)号:CN106875426B
公开(公告)日:2020-01-21
申请号:CN201710094496.7
申请日:2017-02-21
Applicant: 中国科学院自动化研究所
IPC: G06T7/277
Abstract: 本发明公开了一种基于相关粒子滤波的视觉跟踪方法及装置,该方法包括:根据上一时刻的粒子状态和粒子权重在当前时刻生成粒子并进行重采样;对当前时刻重采样得到的每个粒子进行混合相关滤波使其移动并到达一个稳定的位置;使用混合相关滤波响应更新所述每个粒子的权重并更新进行混合相关滤波的相关滤波器的参数;根据更新后的粒子权重对每个粒子状态进行加权从而获得被跟踪目标在当前帧的跟踪状态。
-
公开(公告)号:CN107911719A
公开(公告)日:2018-04-13
申请号:CN201711034839.7
申请日:2017-10-30
Applicant: 中国科学院自动化研究所
IPC: H04N21/25 , H04N21/258 , H04N21/466 , H04N21/45 , G06F17/30 , G06N3/08
Abstract: 本发明涉及社交媒体的视频挖掘和分析技术领域,具体提供了一种视频动态推荐装置,旨在解决如何准确地刻画用户的动态兴趣和视频推荐。为此目的,本发明中的视频动态推荐装置包括视频推荐模型,其可以依据一个或多个历史时刻的视频信息,获取当前时刻的推荐视频。具体地,视频推荐模型包括语义学习单元、用户行为分析单元、循环神经网络、用户相关性挖掘单元和模型训练单元。上述单元不仅可以充分挖掘视频语义信息、用户兴趣信息和不同用户兴趣的相关程度,还可以依据挖掘到的信息进行视频推荐,即实现了对用户观看视频偏好的动态刻画,提高了视频推荐的准确性,特别是提高了对互联网网络在线视频动态推荐的准确性。
-
公开(公告)号:CN105354280A
公开(公告)日:2016-02-24
申请号:CN201510727321.6
申请日:2015-10-30
Applicant: 中国科学院自动化研究所
IPC: G06F17/30
CPC classification number: G06F16/3344 , G06F16/34 , G06F16/36 , G06F16/951
Abstract: 本发明公开了一种基于社会媒体平台的社会事件的挖掘和演变方法,所述方法包括如下步骤:步骤S1,对各个社会事件文档的文本和视觉信息进行特征提取,对社会事件的多模态信息进行语义层次特征提取,从而获得各个社会事件文档的文本和视觉信息的语义描述;步骤S2,输入各个社会事件文档的多模态语义描述,使用基于事件的多模态主题模型(mmETM),对多模态数据的社会事件进行建模,得到代表性的视觉-文本主题和代表性的非视觉主题;步骤S3,针对时序性的社会事件数据,利用基于多模态主题模型(mmETM)的在线推断算法,挖掘其多模态的文本和视觉主题,将整个事件过程可视化显示。
-
公开(公告)号:CN104133807A
公开(公告)日:2014-11-05
申请号:CN201410366722.9
申请日:2014-07-29
Applicant: 中国科学院自动化研究所
Abstract: 本发明公开了一种利用去噪自编码器学习跨平台多模态媒体数据共同特征表示的方法及装置。所述方法包括:步骤S1,建立优化目标方程;目标方程中,采用单层的去噪自编码器来重建不同平台和不同模态的媒体数据特征,在重建时,考虑模态相关性约束和跨平台约束;其中,所述不同平台和不同模态的媒体数据特征包括图像特征和文本特征;步骤S2,求得所述优化目标方程的解析解,在求解析解过程中,通过寻找偏导数为零的点得到全局最优解;步骤S3,利用边缘化方法对所得到的解析解进行求解,其中求解过程中通过弱大数定律来边缘化特征向量的随机噪声进行求解。本发明借助弱大数定律来边缘化特征向量的随机噪声。
-
公开(公告)号:CN102298604A
公开(公告)日:2011-12-28
申请号:CN201110140400.9
申请日:2011-05-27
Applicant: 中国科学院自动化研究所
IPC: G06F17/30
Abstract: 本发明是基于多媒体分析的视频事件检测方法,其包括:利用文本分析对视频进行分析,得到少量的自动标注视频数据;利用多个关键词,通过网络视频搜索引擎,得到事件相关的大量的视频数据;基于图模型的半监督多示例学习算法,利用少量的自动标注视频数据和事件相关的大量的视频数据进行训练,并且利用事件例子的相似度准则及事件包的正负属性准则,构建出事件的数学描述模型,并采取有约束的凸凹过程方法,对事件相关的大量的视频数据进行求解;局部相似度度量学习方法,利用样本的空间分布特性,学习得到有效的相似度,根据学习得到的事件模型实现事件识别和定位;根据事件模型,对视频的内容进行语义分析,得到视频中事件的位置信息。
-
-
-
-
-
-
-
-
-