-
公开(公告)号:CN1245697C
公开(公告)日:2006-03-15
申请号:CN03149998.8
申请日:2003-08-04
Applicant: 北京大学计算机科学技术研究所 , 北京北大方正技术研究院有限公司
Abstract: 本发明属于视频检索技术领域,具体涉及一种通过视频片段进行视频检索的方法。现有的基于内容的视频片段检索方法往往存在着检索精度不高,检索速度慢的问题。针对现有技术中存在的不足,本发明提出在图论最优匹配的框架下来同时解决自动获取相似片段和评价两个片段的相似度这两个片段检索的难题:建立了片段检索的带权二分图模型,通过考察相似镜头的连续性初步得到一个个相似片段,再运用最优匹配的Kuhn_Munkres方法计算这些片段和查询片段的最大权匹配,匹配用于判断两个片段是否相似和确定相似片段的边界,最大权用于表示两个相似片段的相似度。实验结果表明,与现有方法相比,本发明可以取得更高的查准率和查全率,同时也取得了更快的检索速度。
-
公开(公告)号:CN1461142A
公开(公告)日:2003-12-10
申请号:CN03148305.4
申请日:2003-06-30
Applicant: 北京大学计算机科学技术研究所 , 北京北大方正技术研究院有限公司
Abstract: 本发明属于视频检索技术领域,具体涉及一种基于内容的视频片段检索方法。现有的基于内容的视频片段检索方法往往存在着检索精度不高,检索速度慢的问题。针对现有技术中存在的不足,本发明首次运用图论的最大匹配和最优匹配来解决这个问题。首先,通过考察相似镜头的连续性初步得到一个个相似片段,再运用最大匹配的Hungarian算法来确定真正的相似片段。然后,本发明提出用最优匹配的Kuhn-Munkres算法和动态规划算法相结合,来解决片段相似度的度量问题。实践结果表明,与现有方法相比,本发明可以取得更高的检索精度和更快的检索速度,同时在相似片段的排列顺序上,更加符合人的心理特征。
-
公开(公告)号:CN1710562A
公开(公告)日:2005-12-21
申请号:CN200510084212.3
申请日:2005-07-18
Applicant: 北大方正集团有限公司 , 北京北大方正技术研究院有限公司 , 北京大学计算机科学技术研究所
Abstract: 本发明属于视频检索技术领域,具体涉及集成颜色和运动特征进行镜头检索的方法。现有的镜头检索方法仅仅考虑了视频的颜色特征,因此存在检索准确性较低的问题。针对现有技术的不足,本发明提出了同时利用颜色和运动特征进行镜头检索的方法:在颜色特征上,提出利用图论的最优匹配方法度量两个镜头的相似度;在运动特征上,本发明直接在压缩域上提取镜头的运动特征,然后构造镜头的运动直方图度量两个镜头的运动相似度。最后两个镜头的相似度,取决于它们颜色相似度和运动相似度的总和。与仅仅使用颜色特征的现有方法相比,试验对比结果证明了本发明能够取得更高的准确性。
-
公开(公告)号:CN1206847C
公开(公告)日:2005-06-15
申请号:CN03148305.4
申请日:2003-06-30
Applicant: 北京大学计算机科学技术研究所 , 北京北大方正技术研究院有限公司
Abstract: 本发明属于视频检索技术领域,具体涉及一种基于内容的视频片段检索方法。现有的基于内容的视频片段检索方法往往存在着检索精度不高,检索速度慢的问题。针对现有技术中存在的不足,本发明首次运用图论的最大匹配和最优匹配来解决这个问题。首先,通过考察相似镜头的连续性初步得到一个个相似片段,再运用最大匹配的Hungarian算法来确定真正的相似片段。然后,本发明提出用最优匹配的Kuhn-Munkres算法和动态规划算法相结合,来解决片段相似度的度量问题。实践结果表明,与现有方法相比,本发明可以取得更高的检索精度和更快的检索速度,同时在相似片段的排列顺序上,更加符合人的心理特征。
-
公开(公告)号:CN1514644A
公开(公告)日:2004-07-21
申请号:CN03149998.8
申请日:2003-08-04
Applicant: 北京大学计算机科学技术研究所 , 北京北大方正技术研究院有限公司
Abstract: 本发明属于视频检索技术领域,具体涉及一种通过视频片段进行视频检索的新方法。现有的基于内容的视频片段检索方法往往存在着检索精度不高,检索速度慢的问题。针对现有技术中存在的不足,本发明提出在图论最优匹配的框架下来同时解决自动获取相似片段和评价两个片段的相似度这两个片段检索的难题:建立了片段检索的带权二分图模型,通过考察相似镜头的连续性初步得到一个个相似片段,再运用最优匹配的Kuhn_Munkres方法计算这些片段和查询片段的最大权匹配,匹配用于判断两个片段是否相似和确定相似片段的边界,最大权用于表示两个相似片段的相似度。实验结果表明,与现有方法相比,本发明可以取得更高的查准率和查全率,同时也取得了更快的检索速度。
-
公开(公告)号:CN100507910C
公开(公告)日:2009-07-01
申请号:CN200510084212.3
申请日:2005-07-18
Applicant: 北大方正集团有限公司 , 北京北大方正技术研究院有限公司 , 北京大学计算机科学技术研究所
Abstract: 本发明属于视频检索技术领域,具体涉及集成颜色和运动特征进行镜头检索的方法。现有的镜头检索方法仅仅考虑了视频的颜色特征,因此存在检索准确性较低的问题。针对现有技术的不足,本发明提出了同时利用颜色和运动特征进行镜头检索的方法:在颜色特征上,提出利用图论的最优匹配方法度量两个镜头的相似度;在运动特征上,本发明直接在压缩域上提取镜头的运动特征,然后构造镜头的运动直方图度量两个镜头的运动相似度。最后两个镜头的相似度,取决于它们颜色相似度和运动相似度的总和。与仅仅使用颜色特征的现有方法相比,试验对比结果证明了本发明能够取得更高的准确性。
-
公开(公告)号:CN1477600A
公开(公告)日:2004-02-25
申请号:CN03150127.3
申请日:2003-07-18
Applicant: 北京大学计算机科学技术研究所 , 北京北大方正技术研究院有限公司
Abstract: 本发明属于视频检索技术领域,具体涉及一种基于内容的镜头检索方法。现有的基于内容的镜头检索方法往往存在着检索准确率不高的问题。针对现有技术中存在的不足,本发明首次将图论最优匹配的Kuhn_Munkres方法用于镜头检索。与现有方法相比,本发明提出的方法强调在一一对应的前提下,全面客观地度量两个镜头的相似度。把两个镜头的相似度度量建模为一个带权的二分图:镜头中的每一帧看成二分图的一个结点,两个镜头之间任意帧的相似值作为边的权值。在一一对应的前提下,利用Kuhn_Munkres方法求出该二分图的最大权,以此作为两个镜头的相似值。考虑到检索速度问题,提出了两个改进方法。实验对比结果证实了本发明在镜头检索中的优异表现。
-
公开(公告)号:CN1252647C
公开(公告)日:2006-04-19
申请号:CN03150127.3
申请日:2003-07-18
Applicant: 北京大学计算机科学技术研究所 , 北京北大方正技术研究院有限公司
Abstract: 本发明属于视频检索技术领域,具体涉及一种基于内容的镜头检索方法。现有的基于内容的镜头检索方法往往存在着检索准确率不高的问题。针对现有技术中存在的不足,本发明首次将图论最优匹配的Kuhn_Munkres方法用于镜头检索。与现有方法相比,本发明提出的方法强调在一一对应的前提下,全面客观地度量两个镜头的相似度。把两个镜头的相似度度量建模为一个带权的二分图:镜头中的每一帧看成二分图的一个结点,两个镜头之间任意帧的相似值作为边的权值。在一一对应的前提下,利用Kuhn_Munkres方法求出该二分图的最大权,以此作为两个镜头的相似值。考虑到检索速度问题,提出了两个改进方法。实验对比结果证实了本发明在镜头检索中的优异表现。
-
公开(公告)号:CN1828609A
公开(公告)日:2006-09-06
申请号:CN200610072587.2
申请日:2006-04-13
Applicant: 北大方正集团有限公司 , 北京大学 , 北京北大方正技术研究院有限公司
Abstract: 本发明涉及一种基于簇排列的面向主题或查询的多文档摘要方法,属于语言文字处理技术领域。现有的多文档摘要方法,在用户搜索感兴趣的主题时,不能准确地根据用户定义的兴趣爱好等属性返回相关的新闻信息和面向用户属性的摘要。本发明所述的方法提供了一种新的半监督学习算法即基于簇排列的算法,该方法全面考虑了句子之间的相互关系以及句子和用户主题或查询之间的关系,从而使得生成的摘要既能包含文档集的主要信息,又能诠释主题或回答查询,同时利用差异性惩罚算法来保证摘要的新颖性。采用本发明所述的方法能够根据用户的兴趣爱好等需求,返回相关的新闻信息,从而得到更好的面向主题或查询的多文档摘要,可以满足不同用户的个性化需求。
-
公开(公告)号:CN1786965A
公开(公告)日:2006-06-14
申请号:CN200510132372.0
申请日:2005-12-21
Applicant: 北大方正集团有限公司 , 北京北大方正技术研究院有限公司 , 北京大学
IPC: G06F17/30
Abstract: 本发明涉及一种新闻网页正文信息的提取方法,属于网页信息分析处理技术领域。现有技术中,通常采用包装器来抽取网页中感兴趣的数据,而包装器是根据一定的信息模式识别知识从特定的信息源中按固定规则抽取相关内容,并以特定形式加以表示的,包装器所需的信息模式识别知识的获取是一个费时费力且需要较高智能的工作。本发明所述的方法以堆栈数据结构,把网页数据的层次结构信息转化为用向量表达,构建和解析Html树,然后将Html树的各层次数据做对比,进行数据过滤,细化、识别,和数据重组,提取所需的数据信息。采用本发明所述的方法,适用于长期从一固定站点抓取由模版生成的新闻网页中的新闻信息,速度快,准确性高。
-
-
-
-
-
-
-
-
-