-
公开(公告)号:CN100515048C
公开(公告)日:2009-07-15
申请号:CN200710176126.4
申请日:2007-10-19
Applicant: 北京大学
Abstract: 本发明涉及一种图像和视频处理方法及系统,特别是关于一种快速检测在线视频流中静态叠加文字的方法及系统。静态叠加文字检测方法利用帧间相关信息及小波域建模等方法,可以有效的去除运动文字和背景区域,并保留静态叠加文字区域。本方法可以实现对在线视频流中静态叠加文字位置的快速检测。同时,基于静态叠加文字检测方法构建了一种在线视频流检索系统。本系统中,在各个用户终端上使用不同的参数族进行快速的文字检测,并将结果通过OCR控件转化为文本流。在各用户终端将文本流传输至集中检索服务器进行整合后,可以提供对各频道的多时间粒度的检索功能,并提供对各频道的基于内容的快速浏览功能。本发明可以在不侵犯版权的情况下,实现对多路多种质量的在线视频流进行同步分析、索引、检索以及浏览的功能,并且不需要对各种视频流建立专门的服务器。
-
公开(公告)号:CN101847264B
公开(公告)日:2012-07-25
申请号:CN201010193747.5
申请日:2010-05-28
Applicant: 北京大学
Abstract: 本发明公开了一种基于互补显著度图的图像兴趣物体自动提取方法及系统。该方法包括:对同一幅图像,生成两个互补的显著度图,获取两个互补的粗提取结果;将所述两个互补的粗提取结果作为先验知识,采取像素分类方法提取出兴趣物体;对提取出的所述兴趣物体进行优化。本发明通过给定任意图像,在模拟人体视觉感知的情况下自动准确地提取出图像中的兴趣物体,有效地解决了基于显著度方法的结果完整性问题。
-
公开(公告)号:CN101621636B
公开(公告)日:2011-04-20
申请号:CN200810115955.6
申请日:2008-06-30
Applicant: 北京大学
Abstract: 一种基于视觉注意力模型的广告标识自动插入和变换方法及系统,其包括:首先,基于所构建的视觉注意力模型预测用户对视频每帧各区域的兴趣区域和对各帧的关注程度;然后,根据用户对各帧的关注程度曲线来确定插入广告的时间点,并通过基于预测出的注意力分布来评价在各区域插入广告的合适程度,进而获取可供广告插入的候选区域序列,并将广告插入到对视频内容影响不大的区域;最后,根据预测出的注意力分布将广告标志插入到合适的时间点和位置,并对其进行多种特征变换,以使其能够重复吸引用户或观众的注意力。根据本发明可以有效进行广告标识的自动插入和变换,并使所插入的广告标识在不影响正常观看的情况下能够重复吸引人的注意力。
-
公开(公告)号:CN101489139B
公开(公告)日:2010-11-10
申请号:CN200910076782.6
申请日:2009-01-21
Applicant: 北京大学
Abstract: 本发明涉及一种图像和视频处理方法,特别是关于一种基于视觉显著度的视频广告关联方法。本方法中,通过计算采样帧的显著度分布图,可以自动选取一段视频中最受用户关注的显著区域。基于提取的显著区域,本方法可以自动通过多种检索方法,在广告库中获取与这些显著区域相关联的广告标志以及相关信息。最后,将视频片段与查询到的广告信息同步播放给用户。本方法可以在不影响用户观看的情况下,为用户所关注的显著区域关联相关的广告信息,进而满足了用户对其所关注区域深入了解和进一步探索的需求。
-
公开(公告)号:CN101835011A
公开(公告)日:2010-09-15
申请号:CN200910118779.6
申请日:2009-03-11
IPC: H04N5/445
Abstract: 本发明涉及视频检测技术,公开了字幕检测方法及装置、背景恢复方法及装置,其中字幕检测方法包括:获取视频帧中像素区域属于平滑背景的概率;使用帧间相关系数确定所述像素区域属于静止纹理的概率;获取所述像素区域属于动态纹理的概率;根据所述像素区域属于平滑背景的概率、属于静止纹理的概率和属于动态纹理的概率确定所述像素区域是否属于滚动字幕区域。使用本发明实施例提供的技术方案,可以使用帧间信息对视频的字幕进行检测。
-
公开(公告)号:CN101137017A
公开(公告)日:2008-03-05
申请号:CN200710176126.4
申请日:2007-10-19
Applicant: 北京大学
Abstract: 本发明涉及一种图像和视频处理方法及系统,特别是关于一种快速检测在线视频流中静态叠加文字的方法及系统。静态叠加文字检测方法利用帧间相关信息及小波域建模等方法,可以有效的去除运动文字和背景区域,并保留静态叠加文字区域。本方法可以实现对在线视频流中静态叠加文字位置的快速检测。同时,基于静态叠加文字检测方法构建了一种在线视频流检索系统。本系统中,在各个用户终端上使用不同的参数族进行快速的文字检测,并将结果通过OCR控件转化为文本流。在各用户终端将文本流传输至集中检索服务器进行整合后,可以提供对各频道的多时间粒度的检索功能,并提供对各频道的基于内容的快速浏览功能。本发明可以在不侵犯版权的情况下,实现对多路多种质量的在线视频流进行同步分析、索引、检索以及浏览的功能,并且不需要对各种视频流建立专门的服务器。
-
-
-
-
-