-
公开(公告)号:CN104239398B
公开(公告)日:2017-11-21
申请号:CN201410312913.7
申请日:2014-07-02
Applicant: 中国科学院计算技术研究所
IPC: G06F17/30
Abstract: 本发明公开了一种基于密集子图的视觉词典生成方法,包括:密集子图检测步骤用于在基于视觉特征向量间的关系形成的无向图中,通过最大值估计方法进行密集子图检测;视觉词典生成步骤用于通过检测到的密集子图获取组成视觉词典的视觉单词,视觉单词具有单词内部高度相似性、单词外部特征差异性和抗噪性。本发明还公开了一种基于密集子图的视觉词典生成系统。
-
公开(公告)号:CN102883179B
公开(公告)日:2015-05-27
申请号:CN201110194206.9
申请日:2011-07-12
Applicant: 中国科学院计算技术研究所
IPC: H04N17/00
Abstract: 本发明提供一种视频质量客观评价方法,包括:10)在相同时间点切分源视频和待测视频,得到视频片段;20)分别提取来自源视频和待测视频的视频片段中视频帧的视频块,利用时空纹理特征计算对应视频块的相似度,其中所述时空纹理特征体现了像素之间的像素差异;30)根据对应视频块的相似度计算来自待测视频的视频帧的质量分数;40)根据来自待测视频的视频帧的质量分数计算来自待测视频的视频片段的质量值,进而计算待测视频的质量分数。上述方法所获得的质量分数更加符合人的主观感知。
-
公开(公告)号:CN102883180B
公开(公告)日:2014-08-06
申请号:CN201110195375.4
申请日:2011-07-12
Applicant: 中国科学院计算技术研究所
IPC: H04N17/00
Abstract: 本发明提供一种视频质量评价方法,包括:10)将每个待测视频作为图上的一个节点来构建图,根据视频总数量确定需要添加到图上的边的数量,其中观测者成对比较视频的比较结果对应于图的一个边;20)根据所述数量将比较结果映射到图上,将该图作为霍奇分解的输入;30)根据霍奇分解获得每段视频的质量得分。本发明所提供的上述方法在没有降低视频质量评价的准确度的前提下,操作简单、省时省力;而且适合用于网络众包。
-
公开(公告)号:CN102300094A
公开(公告)日:2011-12-28
申请号:CN201110262029.3
申请日:2011-09-06
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供了一种视频编码方法,包括:1)根据每个宏块的受关注程度确定待选编码模式编码的视频与原始视频之间的视频失真D;2)根据视频失真D计算率失真优化(RDO)模型;3)根据RDO模型进行视频编码。本发明的上述方法考虑了人的主观视觉特性,能够在保证人的主观视频质量的条件下有效降低码率。
-
公开(公告)号:CN101404030B
公开(公告)日:2011-07-20
申请号:CN200810225562.0
申请日:2008-11-05
Applicant: 中国科学院计算技术研究所
Abstract: 本发明涉及一种视频中周期性结构片段检测的方法及系统,所述方法包括:步骤1,从所述视频中删除重放片段;步骤2,以子镜头为单元对所述视频进行分解;步骤3,依据被分解出的子镜头间的相似度的距离对所述子镜头进行聚类;步骤4,根据所述子镜头在所述视频中的位置及所述子镜头所属的子镜头类,确定构成周期性结构片段的关键子镜头序列,并从所述视频中匹配出所有所述关键子镜头序列。本发明能够对视频中的周期性结构片段进行有效检测,且不依赖于特定领域知识,可应用到多种不同类型的视频上。
-
公开(公告)号:CN101483542A
公开(公告)日:2009-07-15
申请号:CN200810056069.0
申请日:2008-01-11
Applicant: 中国科学院计算技术研究所
Abstract: 本发明公开了一种对网络流媒体音视频的多维度的访问量统计方法,包括步骤:设置不同形式的音视频访问量统计方法,根据不同形式的访问量统计方法,获取相应的音视频的用户访问的反馈信息;根据用户访问的反馈信息,进行不同的处理,得到不同形式的访问量统计方法的音视频访问量。所述设置不同形式的音视频访问量统计方法,包括:音视频被完整访问的访问量统计方法;或者音视频被访问一定时间的访问量统计方法;或者音视频中的一个片断被访问的访问量统计方法;或者音视频中的多个片段被访问多次的访问量统计方法中的一种或者一种以上的组合。
-
公开(公告)号:CN101354786A
公开(公告)日:2009-01-28
申请号:CN200710119387.2
申请日:2007-07-23
Applicant: 中国科学院计算技术研究所
IPC: G06T7/20
Abstract: 一种体育视频事件分析方法,包含通过提取场地中的标识线及场景分类方法识别事件发生的场地区域,对比赛事件的线路模式进行分类;通过对多对象轨迹的交互分析,针对比赛事件生成球和队员的交互轨迹,据此对比赛事件的交互模式进行层次化的由粗至细分析;最终,形成摘要性质的战术模式总结,呈现给用户。本发明对视频事件中队员(队伍)在完成一次战术动作时所采用战略方法进行从专业角度自动分析,以简洁、清晰的方式呈现出来,给教练和队员的学习和训练以帮助。
-
公开(公告)号:CN1797471A
公开(公告)日:2006-07-05
申请号:CN200410101599.4
申请日:2004-12-24
Applicant: 中国科学院计算技术研究所
Abstract: 本发明公开了一种JPEG图像压缩域上的人体肤色区域检测方法,该方法包括以下步骤:初始化系统参数;对待检测的JPEG图像进行哈夫曼解码和反量化,得到Y,Cb,Cr颜色分量上各个图像块对应的DCT系数;计算每个图像块的颜色特征和纹理特征;计算每个图像块的肤色概率;根据肤色概率和纹理特征判断每个图像块是否是人体肤色区域。本发明的优点在于:本发明方法不需要把图像完全解压缩,直接在压缩码流上操作,提高了人体肤色区域检测的速度;提高了人体肤色区域检测的精度。
-
公开(公告)号:CN119762837A
公开(公告)日:2025-04-04
申请号:CN202411641493.7
申请日:2024-11-18
Applicant: 中国科学院计算技术研究所
IPC: G06V10/764 , G06V10/77 , G06V10/40 , G06V10/82 , G06N3/047 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 本发明提供了一种图像分类模型的训练方法和图像分类方法,该训练方法,包括:获取基于图像的多层级分类训练集;获取图像分类模型,其包括用于从输入的图像提取图像特征的特征提取器和堆叠的多层双向逻辑树;获取预设的自适应的粒度内差异学习网络,学习网络包括多层学习矩阵,每层学习矩阵用于对同层的分类器输出的第一逻辑值进行映射以得到第二逻辑值;利用所述训练集和预设的总损失函数指导图像分类模型和学习网络进行训练,其中,总损失函数被配置为根据第一逻辑值和分类标签指导模型学习每层的分类知识,以及根据第二逻辑值和样本的平滑标签指导模型针对每层学习同层中的各个类别与真实类别的相似度信息,从而更好地提升分类器的性能。
-
公开(公告)号:CN119047517A
公开(公告)日:2024-11-29
申请号:CN202411248753.4
申请日:2024-09-06
Applicant: 中国科学院计算技术研究所
IPC: G06N3/0464 , G06N3/0499 , G06N3/08 , G06V10/26 , G06V10/80 , G06V10/82
Abstract: 本发明提供了一种选取扩散模型的中间变量的方法,包括:选取扩散模型中模块间的中间变量作为候选项,以及选取扩散模型中ViT模块内部的中间变量作为候选项,形成候选集合;针对候选集合中的每个候选项进行定量评价,包括:在训练和测试图像预测模型时,利用候选项对应的扩散表征代替原始图像作为图像预测模型的输入,并在训练完成后基于测试指标评价候选项的性能,其中,候选项对应的扩散表征是指将原始图像输入扩散模型后在候选项对应中间变量处得到的图像特征;从候选集合中,按性能由优到劣的顺序,选择部分候选项为选定项。
-
-
-
-
-
-
-
-
-