-
公开(公告)号:CN101404030A
公开(公告)日:2009-04-08
申请号:CN200810225562.0
申请日:2008-11-05
Applicant: 中国科学院计算技术研究所
Abstract: 本发明涉及一种视频中周期性结构片段检测的方法及系统,所述方法包括:步骤1,从所述视频中删除重放片段;步骤2,以子镜头为单元对所述视频进行分解;步骤3,依据被分解出的子镜头间的相似度的距离对所述子镜头进行聚类;步骤4,根据所述子镜头在所述视频中的位置及所述子镜头所属的子镜头类,确定构成周期性结构片段的关键子镜头序列,并从所述视频中匹配出所有所述关键子镜头序列。本发明能够对视频中的周期性结构片段进行有效检测,且不依赖于特定领域知识,可应用到多种不同类型的视频上。
-
公开(公告)号:CN101241595A
公开(公告)日:2008-08-13
申请号:CN200710063610.6
申请日:2007-02-06
Applicant: 中国科学院计算技术研究所
Abstract: 本发明公开了一种视频情感信息提取方法,包括以下步骤:选择目标视频片断;为所选择的目标视频建立情感的兴奋度模型;为所选择的目标视频建立情感的效价模型;将所建立的情感效价模型的正值映射到一个维度,将情感效价模型的负值映射到另一个维度,然后将情感效价模型的正值、负值、情感兴奋度模型三个分量映射到三维空间,得到情感的三维特征;对映射到三维空间的情感模型进行压缩,得到情感三维模型的压缩模型。
-
公开(公告)号:CN111159539B
公开(公告)日:2023-09-22
申请号:CN201911251785.9
申请日:2019-12-09
Applicant: 中国科学院计算技术研究所
IPC: G06F16/9535 , G16H20/60
Abstract: 本发明提出一种基于多模态信息关联分析的食物推荐方法,包括:根据用户的饮食需求和饮食范围生成第一模态信息;根据食物的自然属性和附加属性生成第二模态信息;根据该用户的实时身体状况和饮食环境状况生成第三模态信息;对该第一模态信息、该第二模态信息和该第三模态信息进行关联性分析,生成针对该用户的食物推荐结果。
-
公开(公告)号:CN115359395A
公开(公告)日:2022-11-18
申请号:CN202210985312.7
申请日:2022-08-17
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供一种基于反事实分析的第一视角视频行为预测模型训练方法,采用第一视角视频训练集对预测模型进行多轮迭代训练直至收敛,其中,每轮训练包括:分别提取每个样本的视觉特征和语义特征;分别对视觉特征和语义特征进行编解码处理得到视觉特征对应的下一时刻的高维特征向量和语义特征对应的下一时刻的高维特征向量;基于高维特征向量分别获得下一时刻的反事实预测向量和事实预测向量;从每个样本对应的事实预测向量中按照相似度抠除反事实预测向量得到下一时刻的最终行为预测向量;每个样本的下一时刻的行为对应的最终预测向量与对应下一时刻的行为标签对应的向量之间的交叉熵损失更新预测模型的参数。
-
公开(公告)号:CN115049913A
公开(公告)日:2022-09-13
申请号:CN202210758373.X
申请日:2022-06-29
Applicant: 中国科学院计算技术研究所
IPC: G06V20/00 , G06V10/26 , G06V10/764 , G06V10/774 , G06V10/82 , G06N3/04 , G06N3/08
Abstract: 本发明提供一种训练场景图像分类模型的方法,所述模型包括卷积神经网络、类别激活图模块,所述方法包括:S1、获取多个原始场景图像并组成原始场景图像数据集,其中,每个原始场景图像对应有场景分类标签;S2、对每个原始场景图像进行掩盖处理来获得其对应的修改图像,并将原始场景图像的场景分类标签作为其对应修改图像的场景分类标签,将原始场景图像与其对应修改图像组成图像对,所有的图像对组成训练集;S3、采用训练集将模型训练至收敛。本发明使得场景图像分类模型去探索了更多的大聚焦区域,提高了场景分类效果。
-
公开(公告)号:CN114118218A
公开(公告)日:2022-03-01
申请号:CN202111283429.2
申请日:2021-11-01
Applicant: 北京三快在线科技有限公司 , 中国科学院计算技术研究所
Abstract: 本说明书公开了一种模型训练的方法,由于终端可以从待训练模型所需的基础损失函数中,以用于收敛该待训练模型中模型参数的相关项作为导函数,并通过求解出该导函数的方式,得到用于训练待训练模型的实际损失函数,这样可以有效地去除基础损失函数中冗余项对待训练模型过程中的不利影响,从而有效地提高了模型训练的效率。
-
公开(公告)号:CN112906780A
公开(公告)日:2021-06-04
申请号:CN202110171006.5
申请日:2021-02-08
Applicant: 中国科学院计算技术研究所
Abstract: 本发明公开了一种果蔬图像分类系统,包括用于提取输入果蔬图像特征图的卷积神经网络、用于识别果蔬图像的低维特征图中的低维关键特征图的低维SCA注意力模块、用于识别果蔬图像的中维特征图中的中维关键特征图的中维SCA注意力模块、用于识别果蔬图像的高维特征图中的高维关键特征图的高维SCA注意力模块、与每一个SCA注意力模块链接的池化层;所述果蔬图像分类系统还包括:多尺度特征融合模块,用于对经池化处理后的低维关键特征图、中维关键特征图、高维关键特征图进行融合处理,生成统一的特征表示;全连接层,用于根据统一的特征表示对果蔬图像进行分类。
-
公开(公告)号:CN111062424A
公开(公告)日:2020-04-24
申请号:CN201911232161.2
申请日:2019-12-05
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供小样本食品图像识别模型训练方法及食品图像识别方法。本发明的模型训练方法包括:利用训练数据集构建包含正、负样本以及锚图像的三元组,输入三元卷积神经网络提取三元组的特征表示;进行特征图融合,获得正负样本图像对特征图;基于所述关系值得分对所述正、负样本图像进行筛选,利用筛选后的正负样本图像对所述特征嵌入网络和关系学习网络进行训练。
-
公开(公告)号:CN106169065B
公开(公告)日:2019-12-24
申请号:CN201610509624.5
申请日:2016-06-30
Applicant: 联想(北京)有限公司 , 中国科学院计算技术研究所
IPC: G06K9/00
Abstract: 本发明公开了一种信息处理方法和电子设备,用于简化对图像的识别过程,所述方法包括:接收用于获取目标图像中信息的请求消息;处理所述目标图像,以确定用于描述所述目标图像的至少一个描述信息;匹配所述请求消息与所述至少一个描述信息;依据匹配结果,输出响应所述请求消息的描述信息。
-
公开(公告)号:CN104239398A
公开(公告)日:2014-12-24
申请号:CN201410312913.7
申请日:2014-07-02
Applicant: 中国科学院计算技术研究所
IPC: G06F17/30
CPC classification number: G06F17/30271 , G06F17/3087
Abstract: 本发明公开了一种基于密集子图的视觉词典生成方法,包括:密集子图检测步骤用于在基于视觉特征向量间的关系形成的无向图中,通过最大值估计方法进行密集子图检测;视觉词典生成步骤用于通过检测到的密集子图获取组成视觉词典的视觉单词,视觉单词具有单词内部高度相似性、单词外部特征差异性和抗噪性。本发明还公开了一种基于密集子图的视觉词典生成系统。
-
-
-
-
-
-
-
-
-