一种结合语义特征的ERVQ图片索引与检索方法

    公开(公告)号:CN105183845B

    公开(公告)日:2018-11-30

    申请号:CN201510562949.5

    申请日:2015-09-06

    Abstract: 本发明公开了一种结合语义特征的ERVQ索引,包括以下步骤:准备训练索引的图片集P1和待索引图片集P2,对P1提取低层特征(SIFT、SURF等),使用残差量化索引(RVQ)训练方法训练得到一个L层的RVQ码书Codebook1,使用ERVQ优化方法调整Codebook1生成码书Codebook2,将码书Codebook2多层质心一一组合构建索引字典,将索引字典每个索引项上根据语义划分成多个倒排链表结构,对P2提取低层特征和语义特征,根据低层特征找到索引项,根据语义特征插入到对应的倒排链表中,查找过程为:对查询图片提取低层特征和语义特征,根据低层特征找到索引项,根据语义找到索引项上倒排链表,最后对返回的多条链表图片排序。本发明的索引结构能够提高基于内容的图片查询结果的精度,并有效减少查询时间。

    一种斯诺克比赛视频事件检测与语义标注方法

    公开(公告)号:CN105183849B

    公开(公告)日:2018-11-02

    申请号:CN201510564255.5

    申请日:2015-09-06

    Abstract: 本发明公开一种斯诺克比赛视频事件检测与语义标注方法,包括:全台面镜头的检测;比分条信息提取;利用隐马尔可夫模型进行音频分类;对回放镜头进行检测;融合多模态的信息并结合斯诺克的领域知识实现斯诺克比赛视频的事件检测与语义标注。本发明方法融合视频内在的多种模态信息,实现了斯诺克比赛视频内容的事件检测与语义标注,为建立基于语义的视频索引打下坚实的基础。

    一种多模态信息融合的足球视频事件检测与语义标注方法

    公开(公告)号:CN104199933B

    公开(公告)日:2017-07-07

    申请号:CN201410449960.6

    申请日:2014-09-04

    Abstract: 本发明公开一种多模态信息融合的足球视频事件检测与语义标注方法,包括:利用潜在语义分析方法检测互联网赛况报道文本描述语句的事件类型;检测足球视频中级语义对象,划分场地区域并进行攻防转换分析,确定视频事件片段的边界;根据中圈和哨声检测结果确定比赛开始时间,利用贝叶斯网络实现攻防片段的初始语义分类;在文本描述中的粗粒度时间信息的约束下,根据文本和视频片段的语义同步文本描述和视频事件,实现足球视频事件的语义标注。本发明方法融合互联网文本信息和视频内在视听特征分析足球视频,提高了视频事件及其边界检测的准确率,实现了足球视频内容的富语义标注,为建立基于语义的视频索引机制打下坚实的基础。

    一种违规使用手机行为的检测方法、监控方法及电子设备

    公开(公告)号:CN118840707A

    公开(公告)日:2024-10-25

    申请号:CN202411024606.9

    申请日:2024-07-29

    Abstract: 本发明公开了一种违规使用手机行为的检测方法、监控方法及电子设备,属于图像处理技术领域,分别使用三个分支进行人体、物体和交互关系检测。每个分支分别通过对应的解码器从图像特征中解码与各自任务相关的特征fiH、fiI、fiO;在这个过程中,通过引入锚框提供空间先验,并通过学习训练集的实例分布,指导查询解码,对每个分支的解码特征均融合fiH、fiI、fiO的相互关系特征和图像特征,从而在解码器之间传递丰富的多重上下文信息,以实现特征增强,进而准确地实现对应的检测任务;其中,关系分支根据人体和物体锚框构建交互区域来获取关系信息,并确保关系分支的关注区域与人、物分支对齐。基于此,本发明能够以较低的成本高效准确地对违规使用手机的行为进行检测。

    一种楼宇内的用户定位导航方法及系统

    公开(公告)号:CN111123198B

    公开(公告)日:2022-02-01

    申请号:CN201911396912.4

    申请日:2019-12-30

    Abstract: 本发明公开了一种楼宇内的用户定位导航方法及系统,包括以下步骤:S1、定位用户当前所在的位置;S2、对楼宇建立分层路径网络,基于所得分层路径网络,根据用户当前所在的位置和用户指定的目的地,进行路径搜索,将路径长度总和最短的路径作为用户当前所在的位置到用户指定目的地的路径;S3、采用PDR定位算法,实时计算用户在行走过程中的位置信息,并按照步骤S2所述的方法,实时更新用户当前所在的位置到目的地之间的路径。通过对楼宇建立分层路径网络,并根据用户当前所在的位置和用户指定的目的地,分情况进行路径搜索,并分层规划路径,实现了多楼层下的路径导航,导航的准确性较高。

    一种面向多核系统的数据流程序任务划分与调度方法

    公开(公告)号:CN107247628B

    公开(公告)日:2019-12-20

    申请号:CN201710480622.2

    申请日:2017-06-22

    Abstract: 本发明公开了一种面向多核系统的数据流程序任务划分与调度方法,主要包括:数据流图节点的分裂算法、GAP任务划分算法、软件流水线调度模型、数据流图节点的双缓冲区机制。本发明的方法利用数据流编程模型所包含的数据并行、任务并行、软件流水并行来最大化程序的并行性,将针对多核架构的特点对数据流程序进行调度,充分发挥了多核处理器的性能。

    一种C/C++与COStream混合编程方法和可视化编译系统

    公开(公告)号:CN107341010B

    公开(公告)日:2019-12-13

    申请号:CN201710491698.5

    申请日:2017-06-26

    Abstract: 本发明公开了一种C/C++与COStream混合编程方法和可视化编译系统,属于计算机编译技术领域。本发明技术方案包括:混合编译前端模式选择;混合编译后端C/C++程序与COStream程序通信交互接口设计;混合编译后端多线程处理接口设计;混合编译后端目标代码的生成。本发明还实现了一种可视化编译系统。本发明技术方案将C/C++与COStream编程结合起来,充分发挥了数据流编程语言COStream在面向多核并行体系结构中的优势,充分发挥了多核处理器的高并行性,而且弥补了C/C++在编写多线程程序复杂性高的问题。

    面向三网融合的电视节目内容搜索与推荐方法

    公开(公告)号:CN105142028B

    公开(公告)日:2018-02-27

    申请号:CN201510455189.8

    申请日:2015-07-29

    Abstract: 本发明公开了一种面向三网融合的电视节目内容搜索与推荐方法。包括:提出同义词标签丰富、评论标签丰富和视频相似度标签丰富三种视频标签自丰富方法生成能详细描述海量电视节目内容的标签描述文件;设计接口完整收集电视节目观众的显式和隐式行为信息,并分别提出了显式和隐式偏好权重计算方法构建基于标签的用户偏好模型,同时考虑了用户偏好随时间的变化;提出基于标签满足关系的相似度计算方法,实现三网融合环境下海量电视节目内容的个性化搜索与主动推荐服务。本方法解决了三网融合环境下海量电视节目内容详细描述的需求,同时为用户提供了更好体验的电视节目个性化服务,从而减少了用户的浏览时间,提高了用户的检索效率。

    面向大规模图像视觉特征的多维倒排索引与快速检索算法

    公开(公告)号:CN103902704B

    公开(公告)日:2017-06-16

    申请号:CN201410126920.8

    申请日:2014-03-31

    Abstract: 本发明公开了面向大规模图像视觉特征的多维倒排索引与快速检索算法,包括:利用图像的视觉特征训练增强型残差量化所需的多层码书,并利用所训练的码书构建多维倒排索引;根据已训练完成的码书,对图像视觉特征进行量化和编码,同时根据计算得到的编码将其插入到倒排索引中对应的倒排列表;利用查询图像视觉特征对所构建的多维倒排索引进行查询,获得查询候选集;利用自适应超球体过滤对查询候选集进行优化,对过滤后的查询结果排序,从而完成图像视觉特征的检索。本发明的方法通过对图像特征进行量化和编码,提高图像特征的量化效率;利用所生成的图像编码构建多维倒排索引,只需要训练少量码书就可以构建倒排索引并提高索引结构的构建速度。

    一种斯诺克比赛视频事件检测与语义标注方法

    公开(公告)号:CN105183849A

    公开(公告)日:2015-12-23

    申请号:CN201510564255.5

    申请日:2015-09-06

    CPC classification number: G06F17/30817

    Abstract: 本发明公开一种斯诺克比赛视频事件检测与语义标注方法,包括:全台面镜头的检测;比分条信息提取;利用隐马尔可夫模型进行音频分类;对回放镜头进行检测;融合多模态的信息并结合斯诺克的领域知识实现斯诺克比赛视频的事件检测与语义标注。本发明方法融合视频内在的多种模态信息,实现了斯诺克比赛视频内容的事件检测与语义标注,为建立基于语义的视频索引打下坚实的基础。

Patent Agency Ranking