-
公开(公告)号:CN104217008A
公开(公告)日:2014-12-17
申请号:CN201410475211.0
申请日:2014-09-17
Applicant: 中国科学院自动化研究所
CPC classification number: G06F17/30793
Abstract: 本发明公开了一种互联网人物视频交互式标注方法和系统,所述方法包括:提取待标注视频中的人脸序列和周边文本中的人名;以人名为文本关键词,利用搜索引擎获得相应人物网络图像集合;计算人脸序列的重要性得分,人脸序列的两两合并推荐得分,以及人脸序列与人物网络图像的相似性,根据上述性质,确定标注时予以显示的人脸序列、人名及人物网络图像;通过多种用户交互操作,产生相应标注行为,实现对视频中人物的标注。本发明通过挖掘多种与待标注视频及人物相关的资源,并设计友好多样的用户交互方式,可简化标注过程,辅助标注决策,有效缓解标注者不认识待标注人物,导致标注过程难以进行的问题,能够大幅度提高人物视频标注的效率和精度。
-
公开(公告)号:CN103984738A
公开(公告)日:2014-08-13
申请号:CN201410218854.7
申请日:2014-05-22
Applicant: 中国科学院自动化研究所
CPC classification number: G06F17/30793
Abstract: 本发明公开了一种基于搜索匹配的影视剧角色标注方法,该方法包括步骤:根据待标注对象列表,得到标注场景的待标注对象集合及所有待标注对象信息;为每位待标注对象构造文本关键词,利用图像搜索引擎获得相应的图像集合;在搜索结果图像上进行人脸检测和视觉属性分析,去除其中的噪声,得到待标注对象与标注场景密切相关的角色人脸集合;对标注场景进行人脸检测和跟踪,得到其中所有的人脸序列;基于人脸序列之间的视觉相似度,以及人脸序列与待标注对象角色人脸的视觉相似度分析,对标注场景进行角色标注。本发明利用互联网中关于影视剧角色的人脸图像进行影视剧角色标注,其有益效果在于:标注过程全自动、标注精度高、方法扩展性和普适性强。
-
公开(公告)号:CN111052126A
公开(公告)日:2020-04-21
申请号:CN201780094559.7
申请日:2017-09-04
Applicant: 华为技术有限公司 , 中国科学院自动化研究所
IPC: G06K9/00
Abstract: 一种行人属性识别与定位方法以及卷积神经网络系统,该方法包括:对待检测图像进行多种不同抽象程度的特征提取,获得行人属性的多种第一特征映射图;对多种第一特征映射图进行卷积,得到多种第二特征映射图,并将每种第二特征映射图映射为多个互有重叠的区域bin,分别对每个bin进行最大池化,得到多种高维特征向量;其中,多个互有重叠的bin均匀地覆盖每种第二特征映射图;将多种高维特征向量处理为低维向量,得到所述行人属性的识别结果;进一步可根据多种第二特征映射图和多种高维特征向量,得到行人属性的定位结果。所述方法能够克服视频监控中的不利因素,对行人属性进行更好的识别与定位。
-
公开(公告)号:CN109902546A
公开(公告)日:2019-06-18
申请号:CN201810523102.X
申请日:2018-05-28
Applicant: 华为技术有限公司 , 中国科学院自动化研究所
Abstract: 本发明实施例涉及人脸识别技术领域,公开了一种人脸识别方法、装置及计算机可读介质,该方法包括:将第一视频数据中包含的n帧图像输入到特征提取网络分别进行人脸特征提取,得到与上述n帧图像一一对应的n个人脸特征矩阵;融合上述n个人脸特征矩阵得到上述待识别人脸的目标人脸特征矩阵;通过上述目标人脸特征矩阵对上述待识别人脸进行人脸识别,得到人脸识别结果;其中2≤n。本申请中,利用从视频数据中提取出的多个人脸特征融合后的人脸特征进行人脸识别,可以提高人脸识别的准确率。
-
公开(公告)号:CN103546667B
公开(公告)日:2016-08-17
申请号:CN201310505496.3
申请日:2013-10-24
Applicant: 中国科学院自动化研究所
IPC: H04N5/222 , H04N21/258 , G06K9/00 , G11B27/10
Abstract: 本发明公开了一种面向海量广播电视监管的自动新闻拆条方法,包括以下步骤:初始化广播电视数据自动获得新闻节目音频波形和视频图像;提取新闻数据的音视频特征,包括主持人检测、字幕检测与跟踪和语音检测;通过启发式规则获取新闻条目边界的视觉候选点和语音候选点;根据音视频融合实现对新闻条目边界的定位计算;上述步骤提供的处理结果,经人工审核后,结果入知识库作为支撑监管需求的知识资源。本发明的有益效果在于:构造的音视频特征符合新闻条目边界描述,设计的音视频融合策略吻合新闻条目组织结构,从而使得新闻拆条过程较现有方法执行效率高,栏目鲁棒性强,结果更为理想。
-
公开(公告)号:CN103546667A
公开(公告)日:2014-01-29
申请号:CN201310505496.3
申请日:2013-10-24
Applicant: 中国科学院自动化研究所
IPC: H04N5/222 , H04N21/258 , G06K9/00 , G11B27/10
Abstract: 本发明公开了一种面向海量广播电视监管的自动新闻拆条方法,包括以下步骤:初始化广播电视数据自动获得新闻节目音频波形和视频图像;提取新闻数据的音视频特征,包括主持人检测、字幕检测与跟踪和语音检测;通过启发式规则获取新闻条目边界的视觉候选点和语音候选点;根据音视频融合实现对新闻条目边界的定位计算;上述步骤提供的处理结果,经人工审核后,结果入知识库作为支撑监管需求的知识资源。本发明的有益效果在于:构造的音视频特征符合新闻条目边界描述,设计的音视频融合策略吻合新闻条目组织结构,从而使得新闻拆条过程较现有方法执行效率高,栏目鲁棒性强,结果更为理想。
-
-
-
-
-