-
公开(公告)号:CN102521340B
公开(公告)日:2014-09-03
申请号:CN201110406765.1
申请日:2011-12-08
Applicant: 中国科学院自动化研究所
Abstract: 本发明公开了一种基于角色的电视剧视频分析,通过人名与人脸的对应关系来关联剧本与视频,使得语义的场景结构能够准确的由剧本映射到视频中。首先,从剧本和视频中分别提取人名与人脸直方图表示,然后利用一种生成式模型对电视剧的拍摄过程进行建模。从模型参数的学习中,可以无监督地学习到人名与人脸的对应关系;从隐状态的推理中,可以最优地得到视频场景的分割。本发明能够在无需人工标注的情况下自动地识别识别视频人脸的身份,特别适用于大规模的视频内容分析;同时,由于引入剧本文件做指导,得到的场景划分具有语义可理解、可比较的优势。
-
公开(公告)号:CN103902730A
公开(公告)日:2014-07-02
申请号:CN201410150911.2
申请日:2014-04-15
Applicant: 中国科学院自动化研究所
CPC classification number: G06T3/0093 , G06T3/20 , G06T3/40
Abstract: 本发明公开了一种缩略图生成方法和系统,通过联合使用裁切、扭曲、缩放三种图像处理策略生成缩略图,发挥了不同策略的优势,并使其互相补充,使图像中的重要区域在缩略图中得到准确、完整、充分的显示,在缩略图的有限空间中实现了重要信息的最大化保留。本发明将以上三种图像处理策略通过一次统一的最优化过程实现,同时具有较少的时间开销。
-
公开(公告)号:CN102521340A
公开(公告)日:2012-06-27
申请号:CN201110406765.1
申请日:2011-12-08
Applicant: 中国科学院自动化研究所
Abstract: 本发明公开了一种基于角色的电视剧视频分析,通过人名与人脸的对应关系来关联剧本与视频,使得语义的场景结构能够准确的由剧本映射到视频中。首先,从剧本和视频中分别提取人名与人脸直方图表示,然后利用一种生成式模型对电视剧的拍摄过程进行建模。从模型参数的学习中,可以无监督地学习到人名与人脸的对应关系;从隐状态的推理中,可以最优地得到视频场景的分割。本发明能够在无需人工标注的情况下自动地识别识别视频人脸的身份,特别适用于大规模的视频内容分析;同时,由于引入剧本文件做指导,得到的场景划分具有语义可理解、可比较的优势。
-
公开(公告)号:CN102364473A
公开(公告)日:2012-02-29
申请号:CN201110352002.3
申请日:2011-11-09
Applicant: 中国科学院自动化研究所
IPC: G06F17/30
Abstract: 本发明提出了一种融合地理信息与视觉信息的网络新闻检索系统及方法。该系统包括:数据预处理模块,用于爬取新闻数据并进行文本分析和信息数据提取,所述新闻数据包括人物,地点、时间和文本信息;地点相关性分析模块,用于执行新闻事件与新闻地点的相关性分析;新闻配图模块,用于为新闻选择合适的图像;检索结果展示模块,用于基于检索相关性排序展示检索到的新闻。本发明的系统及方法综合利用了地理位置信息和视觉信息对网络新闻进行描述与展示,为网络用户提供基于地理位置的多媒体新闻检索,同时综合了新闻地点-新闻事件的关系、新闻地点的相关性以及新闻事件之间的关系,从而提供给用户一个更生动、更富信息的新闻搜索结果。
-
公开(公告)号:CN102256065A
公开(公告)日:2011-11-23
申请号:CN201110208090.X
申请日:2011-07-25
Applicant: 中国科学院自动化研究所
Abstract: 一种基于视频监控网络的视频自动浓缩方法,其是从两个具有重叠区域的摄像机获得第一视频源和第二视频源并对运动目标分割和跟踪,提取背景图像和视频监控网络运动轨迹;根据背景图像生成基于视频监控网络的全景图像,得到两个摄像机各自对应于全景图像的投影矩阵并实时更新基于视频监控网络背景的全景图像;利用两个摄像机全景图像的投影矩阵,把轨迹投影到全景图像空间得到投影轨迹;采用图匹配,基于随机游走思想对两个摄像机的视频源的投影轨迹匹配,得到匹配轨迹对,对重叠区域的匹配轨迹进行选择和融合,得到完整的大场景轨迹;对大场景轨迹按时间重新排列,在全景图像上对完整的大场景轨迹进行展现,得到基于全景图像的视频浓缩。
-
公开(公告)号:CN102122358A
公开(公告)日:2011-07-13
申请号:CN201110081240.5
申请日:2011-03-31
Applicant: 中国科学院自动化研究所
IPC: G06K9/62
Abstract: 本发明提出一种基于提升稀疏约束双线性模型的图像进行分类方法,该方法的图像分类步骤如下:步骤S1:在图像上提取图像的局部特征;步骤S2:从图像上密集的提取多个部件;步骤S3:将各个部件用视觉词的直方图作为部件的特征表示,并将每个部件的特征表示按顺序排列起来,用一个矩阵的形式来表示图像;步骤S4:使用提升稀疏约束双线性模型模拟视觉词到部件、部件到图像类别之间的关系,从而达到对图像分类的目的。为了提高方法的判别力,我们加入了稀疏性的约束,并采用提升的策略来提高方法的鲁棒性。在三个数据库上的实验结果,证实了我们的方法的有效性。
-
公开(公告)号:CN101026761B
公开(公告)日:2010-05-12
申请号:CN200610007814.3
申请日:2006-02-17
Applicant: 中国科学院自动化研究所
Abstract: 本发明涉及视频压缩技术领域,一种最小误差的快速变尺寸块匹配的运动估计方法。包括:改进的“自下而上”的变尺寸块匹配方法、宏模式预测方法和后处理方法;改进的变尺寸块匹配方法将匹配误差最小的运动矢量作为候选矢量,即将每一个小块的最小匹配误差设为阈值,使变尺寸块匹配方法的匹配误差达到最小;在宏模式预测时,前一个帧间预测帧的宏块模式选择结果用来指导随后帧间预测帧的宏块选择,如果当前帧的当前宏块对应的前一帧的块模式为宏块模式,则进行MMP运算。对应的运动矢量用作预测矢量;后处理方法进一步考察使用mini-模式表示的平滑区域,首先确定所有16个小块的匹配误差小于32,否则认为该区域存在复杂运动,使用mini-模式是合理的。
-
公开(公告)号:CN100534179C
公开(公告)日:2009-08-26
申请号:CN200510126322.1
申请日:2005-12-07
Applicant: 中国科学院自动化研究所
Abstract: 本发明涉及数字音视频传输技术领域,一种面向AVS1.0的传输流离线复用方法。该方法首先分析每个音视频基本流的许多基本信息,设定了节目特定信息(PSI)表的传送频率等基本信息;其次根据这些基本的信息来计算复用时节目相关表(PAT)、节目映射表(PMT)、节目时钟参考(PCR)和每个音视频基本流的时间单位;然后根据每个节目所包含的音视频基本流设定PMT表、设置PAT信息表,设定输出码率。一切设置完毕后,开始复用输出传输流(TS)。生成得到的传输流符合DVB系统测量标准之一TR 101-290定义的三个优先级。该方法不仅适用于最新的音视频标准AVS1.0,同时也适应于MPEG-2。
-
公开(公告)号:CN101064825A
公开(公告)日:2007-10-31
申请号:CN200610076013.2
申请日:2006-04-24
Applicant: 中国科学院自动化研究所
Abstract: 本发明涉及移动通信多媒体技术领域,特别是一种基于移动设备的体育视频的个性化定制方法及其装置。方法步骤包括:获取体育视频数据步骤、建立视频处理服务器端步骤、无线网络传输步骤、建立客户端步骤。其装置包括:体育视频模块、视频获取模块、精彩事件检测模块、体育视频服务控制台、体育视频合成输出模块、无线网络传输层、移动客户端。本发明基于服务器-客户端模式,根据不同的移动设备的性能、不同的网络带宽和用户的不同需求,为移动用户提供个性化的体育视频浏览;本发明能够较好在基于无线网络传输的移动设备上有效的收看体育视频,有效的个性化定制体育视频,提供的无线传输速度能满足常规的视频收看方式的需求。
-
公开(公告)号:CN101055617A
公开(公告)日:2007-10-17
申请号:CN200610073171.2
申请日:2006-04-10
Applicant: 中国科学院自动化研究所
Abstract: 本发明涉及计算机视觉与模式识别领域,具体地涉及基于局部描述子的人脸快速检测方法,包括:基于灰度图像,基于局部区域的二进制编码特征,通过学习训练得到人脸检测子来检测灰度图像中人脸的位置及其尺度大小。本发明基于二进制局部特征的方法,对光照条件较差的图像检测也能获得较好效果,计算简便,训练代价小,可实现性好,因此可以很方便的应用到个人计算机以及移植到嵌入式系统中去。本发明应用于计算机视觉与模式识别比如:生物特征认证、信息安全、人机交互、以及视觉监控。
-
-
-
-
-
-
-
-
-