视觉信息辅助的即时通信方法及系统

    公开(公告)号:CN102567509B

    公开(公告)日:2014-08-27

    申请号:CN201110441927.5

    申请日:2011-12-26

    Abstract: 本发明公开了一种视觉信息辅助的即时通信方法及系统,该方法包括以下步骤:构建图片数据库;根据用户输入的文本信息提取语义关键词,分析得出关键词之间的语法关系;基于提取出的关键词,利用上下文语义线索和图片的显著度从图片数据库选择吻合即时通信上下文的语境的代表性图片;利用关键词之间的语法关系,合理排布代表性图片,形成视觉信息,并连同所述文本信息一同传递给对方用户。本发明还提供了一种视觉信息辅助的即时通信系统。本发明将传递抽象概念的文本信息与传递形象概念的视觉信息结合起来,通过两者的互补,帮助用户更好地表达自己,理解对方,同时本发明还整合了机器翻译模块,对于不同母语的用户,能够将视觉信息和机器翻译结果共同呈现给用户。

    基于提升稀疏约束双线性模型的图像分类方法

    公开(公告)号:CN102122358B

    公开(公告)日:2014-03-26

    申请号:CN201110081240.5

    申请日:2011-03-31

    Abstract: 本发明提出一种基于提升稀疏约束双线性模型的图像进行分类方法,该方法的图像分类步骤如下:步骤S1:在图像上提取图像的局部特征;步骤S2:从图像上密集的提取多个部件;步骤S3:将各个部件用视觉词的直方图作为部件的特征表示,并将每个部件的特征表示按顺序排列起来,用一个矩阵的形式来表示图像;步骤S4:使用提升稀疏约束双线性模型模拟视觉词到部件、部件到图像类别之间的关系,从而达到对图像分类的目的。为了提高方法的判别力,我们加入了稀疏性的约束,并采用提升的策略来提高方法的鲁棒性。在三个数据库上的实验结果,证实了我们的方法的有效性。

    一种新闻检索结果的多媒体摘要生成方法

    公开(公告)号:CN102411638B

    公开(公告)日:2013-06-19

    申请号:CN201110455758.0

    申请日:2011-12-30

    Abstract: 本发明公开了一种新闻检索结果的多媒体摘要生成方法,该方法采用自然语言处理技术预处理新闻文档,提取命名实体;采用层次潜在狄利克雷分布模型在与查询相关的新闻信息中挖掘出潜在的主题;采用基于权重聚合和最大池模型算法从每个主题中筛选出典型文档,同时也挑选出典型的新闻图片;采用考虑时间信息的最大生成树将各个主题串联成连续紧凑的摘要,生成一个与查询相关的简要概述。本发明能够对新闻信息采用综合文本与图片的多媒体形式进行总结凝练,为用户提供生动形象、全面具体的新闻时事展示,使其能够掌握到所关心新闻的前因后果和事件的发展历程。

    基于动态群组划分的多目标跟踪方法

    公开(公告)号:CN102148921B

    公开(公告)日:2012-12-12

    申请号:CN201110113290.7

    申请日:2011-05-04

    Abstract: 本发明是基于动态群组划分的多目标跟踪方法,所述多目标跟踪方法包括步骤如下:S1:对于视频场景中的某一时刻,首先判定是否有目标进入或离开场景区域,根据检测结果更新目标集合;S2:设定目标集合的分组阈值,使用层次聚类按距离对上一时刻目标集合进行聚类,根据上一时刻的聚类结果,将上一时刻目标位置分成不同群组;S3:为目标集合中的每个群组分配一个跟踪器,跟踪器根据群组内每个目标上一时刻的位置状态,加上群组内每个目标当前时刻在图像上的观测值,使用贝叶斯框架推断每个目标在当前时刻位置的最优值,用每个目标当前时刻位置的最优值更新目标集合中各个目标的位置状态,为推断各个目标的下一时刻的位置做准备。

    用计算机对运动目标的场景图像建立语义场景模型的方法

    公开(公告)号:CN102054176B

    公开(公告)日:2012-09-26

    申请号:CN201010603240.2

    申请日:2010-12-23

    Abstract: 本发明用计算机对运动目标的场景图像建立语义场景模型的方法,包括步骤S1:利用图像处理设备输入的视频数据,得到待处理的运动目标图像数据,进行目标检测和跟踪;步骤S2:基于协同训练方法学习行人和车的分类器,减少训练标注样本和充分利用目标的多种特征;根据学习得到的分类器,将目标分为行人和车辆;步骤S3:对于每类目标的轨迹进行轨迹聚类,得到目标的轨迹聚类;步骤S4:根据目标的轨迹聚类,得到每种轨迹的分布区域,并且利用均值漂移算法得到每种轨迹分布区域的主要轨迹和轨迹的入点和出点,从而得到有一定语义的区域和实现应用。

    视觉信息辅助的即时通信方法及系统

    公开(公告)号:CN102567509A

    公开(公告)日:2012-07-11

    申请号:CN201110441927.5

    申请日:2011-12-26

    Abstract: 本发明公开了一种视觉信息辅助的即时通信方法及系统,该方法包括以下步骤:构建图片数据库;根据用户输入的文本信息提取语义关键词,分析得出关键词之间的语法关系;基于提取出的关键词,利用上下文语义线索和图片的显著度从图片数据库选择吻合即时通信上下文的语境的代表性图片;利用关键词之间的语法关系,合理排布代表性图片,形成视觉信息,并连同所述文本信息一同传递给对方用户。本发明还提供了一种视觉信息辅助的即时通信系统。本发明将传递抽象概念的文本信息与传递形象概念的视觉信息结合起来,通过两者的互补,帮助用户更好地表达自己,理解对方,同时本发明还整合了机器翻译模块,对于不同母语的用户,能够将视觉信息和机器翻译结果共同呈现给用户。

    一种提取地标性场景摘要的方法

    公开(公告)号:CN101777059B

    公开(公告)日:2011-12-07

    申请号:CN200910242751.3

    申请日:2009-12-16

    Abstract: 本发明是一种提取地标性场景摘要的方法,该方法包括步骤如下:对每一幅地标性场景图像,提取颜色矩、小波纹理作为地标性场景图像的全局特征,提取SIFT描述子作为地标性场景图像的局部特征;利用全局特征对地标性场景图像库,根据图像的二维特征进行初始聚类;利用局部特征对初始聚类结果,从每一类中选取距离聚类中心最近的若干幅代表性图像,并对代表性图像进行两两匹配进行基于显著性几何验证;几何验证之后,从每一个聚类集合中提取标志性图像;利用类间几何验证对选出地标性场景图像中用户感兴趣的区域的标志性图像进行几何匹配筛选,将相同或相近视角的标志性图像聚为一类,从而实现相似类的融合,提取出地标性场景摘要。

    基于特征线的体育视频镜头分类方法

    公开(公告)号:CN101465003B

    公开(公告)日:2011-05-11

    申请号:CN200710179882.2

    申请日:2007-12-19

    Inventor: 卢汉清 张奕

    Abstract: 本发明涉及一种基于特征线的体育视频镜头分类方法,在待分类视频镜头的采样帧中,根据场地、球员、观众在不同类别镜头中,在局部区域出现可能性的差异选择最能反映镜头类别差异的局部位置确定为特征线的位置;在确定的特征线上统计各条特征线上象素点颜色的均方误差值MSE作为最终镜头分类的特征;根据各特征线上象素点颜色的均方误差值来对采样帧所属镜头进行分类。不仅克服了传统基于主颜色面积比率的镜头分类方法受背景影响的缺点,提高了分类准确性,同时还具有计算简单、效率高的有点。本发明不但适合于足球视频,对于其它类似的场地球类项目视频如橄榄球、曲棍球等同样适用。

    一种提取地标性场景摘要的方法

    公开(公告)号:CN101777059A

    公开(公告)日:2010-07-14

    申请号:CN200910242751.3

    申请日:2009-12-16

    Abstract: 本发明是一种提取地标性场景摘要的方法,该方法包括步骤如下:对每一幅地标性场景图像,提取颜色矩、小波纹理作为地标性场景图像的全局特征,提取SIFT描述子作为地标性场景图像的局部特征;利用全局特征对地标性场景图像库,根据图像的二维特征进行初始聚类;利用局部特征对初始聚类结果,从每一类中选取距离聚类中心最近的若干幅代表性图像,并对代表性图像进行两两匹配进行基于显著性几何验证;几何验证之后,从每一个聚类集合中提取标志性图像;利用类间几何验证对选出地标性场景图像中用户感兴趣的区域的标志性图像进行几何匹配筛选,将相同或相近视角的标志性图像聚为一类,从而实现相似类的融合,提取出地标性场景摘要。

    基于局部描述子的人脸快速检测方法

    公开(公告)号:CN100412884C

    公开(公告)日:2008-08-20

    申请号:CN200610073171.2

    申请日:2006-04-10

    Abstract: 本发明涉及计算机视觉与模式识别领域,具体地涉及基于局部描述子的人脸快速检测方法,包括:基于灰度图像,基于局部区域的二进制编码特征,通过学习训练得到人脸检测子来检测灰度图像中人脸的位置及其尺度大小。本发明基于二进制局部特征的方法,对光照条件较差的图像检测也能获得较好效果,计算简便,训练代价小,可实现性好,因此可以很方便的应用到个人计算机以及移植到嵌入式系统中去。本发明应用于计算机视觉与模式识别比如:生物特征认证、信息安全、人机交互、以及视觉监控。

Patent Agency Ranking