一种基于显式共享子空间的视频广告检测方法

    公开(公告)号:CN102436483A

    公开(公告)日:2012-05-02

    申请号:CN201110335633.4

    申请日:2011-10-31

    Abstract: 本发明公开了多媒体检索技术领域中的一种基于显式共享子空间的视频广告检测方法。首先将镜头分割成语义镜头序列,提取出其中的关键帧,得到视觉特征和音频特征,进而得到显式共享子空间和两者构成的映射矩阵的特征值;然后通过选取指定的映射矩阵的特征值在显式共享子空间中对应的向量,求得视觉特征映射矩阵和音频特征映射矩阵;实现降维和特征融合操作;将特征融合得到的矩阵输入到支持向量机中进行训练,得到最优分类模型后,用其对待检测镜头进行初步判断,最后通过后处理步骤最终确定待检测镜头是否为广告镜头。本发明不需要建立广告数据库,使用起主要作用的向量对镜头检测,最后通过后处理步骤对镜头判断,提到了检测的有效性和准确率。

    一种基于分层匹配的视频广告识别方法

    公开(公告)号:CN101162470A

    公开(公告)日:2008-04-16

    申请号:CN200710177523.3

    申请日:2007-11-16

    Inventor: 赵耀 刘楠 朱振峰

    CPC classification number: G06K9/00711

    Abstract: 一种基于分层匹配的视频广告识别方法,通过局部敏感性哈希算法(Locality Sensitive Hash,LSH)和精细尺度连续过滤算法(Fine Granularity Successive Elimination,FGSE),利用广告的新颖的视频特征结合后处理技术开发出一套能够快速检测电视节目中是否存在数据库中的广告。技术方案是:其特征在于包含以下步骤:离线数据库建立与在线监测,其中离线数据库建立分为离线预处理与哈希表建立;在线监测部分分为在线预处理、由粗糙到精细的二级匹配和后处理。

    基于SAM分割的水平眼球震颤检测方法及系统

    公开(公告)号:CN118507020A

    公开(公告)日:2024-08-16

    申请号:CN202410513018.5

    申请日:2024-04-26

    Abstract: 本发明提供一种基于SAM分割的水平眼球震颤检测方法及系统,属于基于深度学习的医疗信息处理技术领域,获取眼动视频数据;眼动视频数据进行预处理,实现眼动视频中无效帧和有效帧的判断,去除视频中的无效帧;对预处理后的眼动视频数据中的每一图像帧利用分割网络进行眼球分割,得到图像帧的眼球分割掩膜;对眼球分割掩膜进行质心计算得到瞳孔中心点,获取眼动视频的眼球运动轨迹序列;使用预先训练好的一维时序卷积分类器对眼球运动轨迹序列进行处理,得到有无水平眼震的结果。本发明通过挖掘水平眼震特征,建立基于深度学习的自动水平眼球震颤检测模型,可以为最终的诊断提供有价值的参考依据,辅助医务人员完成诊断与治疗,提高患者的就诊效率。

    基于由粗到精学习的半监督多模态核磁共振影像合成方法

    公开(公告)号:CN114170118A

    公开(公告)日:2022-03-11

    申请号:CN202111226162.3

    申请日:2021-10-21

    Abstract: 本发明提供了一种基于由粗到精学习的半监督多模态核磁共振影像合成方法。该方法包括:利用所有病例的多模态数据集构造大部分不成对数据和少部分成对数据,构造包括生成网络和增强网络的MRI合成模型,利用全部数据对生成网络进行训练,利用少部分成对数据对增强网络进行训练,将源模态的影像输入训练好的生成网络中,利用学习得的跨模态分布映射关系将源模态的影像映射为对应的目标模态的粗合成影像,并输入到训练好的增强网络,增强网络对目标模态的粗合成影像进行精细化增强,得到目标模态的跨模态合成MR影像。本发明方法可以应用于跨模态医学影像合成中,使用患者已有的源模态影像合成目标模态影像,为辅助医生进行疾病诊断提供帮助。

    一种基于视频重构的重复片段定位方法

    公开(公告)号:CN102750339B

    公开(公告)日:2014-04-16

    申请号:CN201210182770.3

    申请日:2012-06-05

    Abstract: 本发明公开了一种基于视频重构的重复片段定位方法,包括以下步骤:去除查询视频序列和引用视频序列中视频帧与视频帧之间存在的大量冗余,为时间临近、内容一致的小段视频抽取具有代表性的视频关键帧,实现数据的精简处理;利用伪文本文档来描述视频关键帧内容;将视频关键帧之间的视觉相似性计算转化为伪文本文档之间的相似性度量,对查询视频关键帧和引用视频关键帧之间的相似性进行度量,进而为每一幅查询关键帧返回一系列相似引用关键帧;综合利用重复视频片段的时间一致性约束及不重复片段之间的时间不连续性来重构引用视频片段、确定重复视频片段的边界信息。可用于数字媒体挖掘、版权保护。

    一种融合文本语义和视觉内容的Web人像检索方法

    公开(公告)号:CN101388022B

    公开(公告)日:2010-06-09

    申请号:CN200810118253.3

    申请日:2008-08-12

    Inventor: 赵耀 谢琳 朱振峰

    Abstract: 本发明涉及一种融合文本语义和视觉内容的Web人像检索方法,该方法如下:向商业搜索引擎服务器提交“查询串”实现基于HTTP协议的连接和下载功能,下载商业图片搜索引擎的图片结果及相关网页作为本地图像库,同时抽取原始网页的关键标签形成后期文本处理使用的XML文件;采用AdaBoost人脸检测技术,并对包含图片的网页脚本进行向量模型的高层语义挖掘,并使用经验权值和基于PLSA的动态加权方法进行对比;通过一个调节因子,将对图像进行的视觉上和文本上的特征分析结果动态结合,得到图像与查询的相关度排序值,重新排序搜索引擎图像结果列表,并反馈给用户。本方法有更高的查准率,特别是特征融合之后有了大幅度的提高。

    融合伪相关反馈与检索技术的自动图像标注方法

    公开(公告)号:CN101075263A

    公开(公告)日:2007-11-21

    申请号:CN200710118106.1

    申请日:2007-06-28

    Abstract: 本发明提供一种融合伪相关反馈与检索技术的自动图像标注方法,包含:步骤1,在已标注的图像库中对未标注的查询图像进行检索,得到k个相关图像及相关图像的标注词集合;步骤2,计算每个标注词标注查询图像的后验概率;步骤3,根据k个相关图像提取均值向量作为新的查询向量,重复步骤1、2,直到最大迭代次数N;步骤4,计算每个标注词在每轮标注词集合中的稳定性因子;步骤5,根据后验概率及稳定性因子的值,计算每个标注词标注查询图像的排序概率,对查询图像进行标注。本发明的优点在于:提高了检索性能及标注的准确性,极大地改善了标注的可伸缩性,是一个灵活可靠、有实用价值的标注方法。

    一种基于多视角的交互式视频搜索方法

    公开(公告)号:CN101071439A

    公开(公告)日:2007-11-14

    申请号:CN200710099532.5

    申请日:2007-05-24

    Abstract: 本发明公开了一种基于多视角的交互式视频搜索方法,属于视频搜索技术领域。本发明将多视角技术应用于交互式视频检索,开发了一种基于多视角的交互式视频搜索方法。本发明以一种半监督的学习方式,从多个独立视角来构造一个新的排序函数,其优点是只需要很少的标注样本就可以开始一个学习过程,并且从多个视角迭代的增加样本容量,并最终提高检索的性能。

    结合病史和体征信息的头晕眩晕疾病辅助诊断方法及系统

    公开(公告)号:CN118471466A

    公开(公告)日:2024-08-09

    申请号:CN202410463309.8

    申请日:2024-04-17

    Abstract: 本发明提供一种结合病史和体征信息的头晕眩晕疾病辅助诊断方法及系统,属于基于深度学习的智能医疗辅助诊断设备技术领域,获取患者的病史信息和体征信息;对于病史信息和体征信息中的特征变量,应用CED模型获得数字类型的嵌入,利用自适应梯度提升决策树模型对患者的病史信息和体征信息进行表示学习,得到特定患者的特征重要性表示;根据病史和体征之间的相关性对病史信息和体征信息进行降维;采用预先训练好的集成分类模型结合投票决策,对降维后的病史信息和体征信息进行处理,得到患者的属于头晕或者眩晕的疾病分类。本发明结合通过临床病史和通过检查获得的体征数据对头晕、眩晕亚型进行分类,提高了对头晕、眩晕的亚型分类的精确性。

Patent Agency Ranking