一种视频情感信息提取方法

    公开(公告)号:CN101241595A

    公开(公告)日:2008-08-13

    申请号:CN200710063610.6

    申请日:2007-02-06

    Abstract: 本发明公开了一种视频情感信息提取方法,包括以下步骤:选择目标视频片断;为所选择的目标视频建立情感的兴奋度模型;为所选择的目标视频建立情感的效价模型;将所建立的情感效价模型的正值映射到一个维度,将情感效价模型的负值映射到另一个维度,然后将情感效价模型的正值、负值、情感兴奋度模型三个分量映射到三维空间,得到情感的三维特征;对映射到三维空间的情感模型进行压缩,得到情感三维模型的压缩模型。

    图像压缩域上的人体肤色区域检测方法

    公开(公告)号:CN100377177C

    公开(公告)日:2008-03-26

    申请号:CN200410101599.4

    申请日:2004-12-24

    Abstract: 本发明公开了一种JPEG图像压缩域上的人体肤色区域检测方法,该方法包括以下步骤:初始化系统参数;对待检测的JPEG图像进行哈夫曼解码和反量化,得到Y,Cb,Cr颜色分量上各个图像块对应的DCT系数;计算每个图像块的颜色特征和纹理特征;计算每个图像块的肤色概率;根据肤色概率和纹理特征判断每个图像块是否是人体肤色区域。本发明的优点在于:本发明方法不需要把图像完全解压缩,直接在压缩码流上操作,提高了人体肤色区域检测的速度;提高了人体肤色区域检测的精度。

    一种尺寸无关的多物体显著性检测方法及装置

    公开(公告)号:CN118736191A

    公开(公告)日:2024-10-01

    申请号:CN202410738342.7

    申请日:2024-06-07

    Abstract: 本发明提出一种尺寸无关的多物体显著性检测方法,其特征在于,包括:对训练样本中物体做最小外接框,得到多个物体框,将训练样本中除物体框以外的部分作为背景框;通过语义分割模型,对背景框和每个物体框内的显著区域进行独立评价,得到在每个物体框和背景框的显著区域独立检测结果;对各显著区域独立检测结果进行合并,得到显著区域合并检测结果;根据显著区域标签,在每个物体框和背景框内独立地计算损失,得到背景框和每个物体框的独立损失函数;合并所有独立损失函数,得到合并损失函数,以训练语义分割模型;将待显著物体检测的多物体图像通过数据处理步骤处理后,输入训练完成后的语义分割模型,得到其显著区域检测结果。

    一种基于多标签对图像分类模型训练的方法

    公开(公告)号:CN118247567A

    公开(公告)日:2024-06-25

    申请号:CN202410386788.8

    申请日:2024-04-01

    Abstract: 本发明提供了一种基于多标签对图像分类模型训练的方法,所述方法包括:获取训练集,所述训练集包括多个分布内图像样本和多个分布外图像样本,以及指示各个分布内图像样本所属类别的标签,其中,所述分布外图像样本为不属于分布内图像样本所属任意类别的图像样本;利用训练集对图像分类模型进行一次或者多次训练,其中,利用图像分类模型提取输入图像在各个类别上的logit值和置信度,每次训练时,基于预设的总损失函数确定的总损失更新图像分类模型的参数,得到经训练的图像分类模型,所述总损失根据以下损失加权求和确定:分布内损失、分布外损失和能量分布差距损失。

    一种图像处理系统的构建方法、图像处理系统及方法

    公开(公告)号:CN118212315A

    公开(公告)日:2024-06-18

    申请号:CN202410305781.9

    申请日:2024-03-18

    Abstract: 本发明提供了一种图像处理系统的构建方法,该方法包括:筛选出多种图像生成方法;构建初始图像处理系统,其包括:表征模块和处理模块,其中,表征模块用于基于筛选出的多种图像生成方法和预训练的扩散模型得到输入图像的多个子表征并对其进行拼接处理以得到输入图像的表征;利用输入图像、输入图像上图像任务处理的标签对初始图像处理系统进行多次迭代训练,并在每次迭代训练过程中按照预设的损失更新图像处理系统的参数。采用本发明的方法能够显著提升表征模块的表征学习能力,即使用本发明构建的表征模块用于表征学习时能够得到内容更准确的图像表征,以使下游的处理模块基于该图像表征完成图像处理任务时能够得到更加准确的处理结果。

    一种图像二分类模型的训练方法、图像识别方法

    公开(公告)号:CN117576496A

    公开(公告)日:2024-02-20

    申请号:CN202311286454.5

    申请日:2023-10-07

    Abstract: 本发明实施例提供了一种图像二分类模型的训练方法,图像二分类模型用于判定图像为二分类中的一类的概率,该方法包括:S1、获取原始图像训练集;S2、对所述原始图像训练集按照预设的规则添加分布扰动,得到对应的图像对抗训练集;S3、利用图像对抗训练集对所述图像二分类模型进行多次迭代训练,并在每次迭代训练时基于正样本为目标图像的概率预测值以及负样本为目标图像的概率预测值计算图像二分类模型的性能评估结果;S4、根据图像二分类模型的性能评估结果,基于目标逐样本损失函数更新图像对抗训练集以及图像二分类模型中可学习的参数。通过上述方法训练图像二分类模型,提高了AUC在分布扰动下的鲁棒性,从而提高图像二分类模型的性能。

    一种图像分类系统及其训练方法、图像分类方法

    公开(公告)号:CN117079042A

    公开(公告)日:2023-11-17

    申请号:CN202311068705.2

    申请日:2023-08-23

    Abstract: 本发明实施例提供了一种图像分类系统,用于对输入的图像进行分类,该系统包括:特征提取模块,用于对图像进行特征提取,以得到图像对应的特征向量;特征旋转模块,用于基于正交投影矩阵对特征向量进行旋转得到旋转后的特征向量,其中,所述正交投影矩阵是从预设的正交矩阵提取;分类模块,其包括:固定参数线性层用于对旋转后的特征向量进行均衡得到图像属于每个类别的logit值;分类层用于基于图像属于每个类别的logit值确定图像属于每个类别的置信度。本发明实施例设计的图像分类系统对长尾图像分类场景的泛化性好以及模型本身的性能也好。

    一种抑制语言偏差的视觉问答方法及系统

    公开(公告)号:CN113407794B

    公开(公告)日:2023-10-31

    申请号:CN202110608491.8

    申请日:2021-06-01

    Abstract: 一种用于抑制语言偏差的贪心梯度集成方法,其特征在于,包括下列步骤:将视觉问答任务建模为一加性模型,该加性模型分为广义相加的基础模型与偏差模型;对该加性模型各部逐一进行优化,先对偏差模型进行优化,利用二值交叉熵损失函数求该偏差模型最小损失:将m(m∈N*)个偏差模型函数代入二值交叉熵损失函数,对该二值交叉熵损失函数求负梯度以获得第m+1偏差模型函数的优化方向;优化该所有偏差模型后,以所有偏差模型的负梯度为监督,再对该基础模型进行优化。

    融合元路径语义的推荐方法及系统

    公开(公告)号:CN112861006B

    公开(公告)日:2023-06-23

    申请号:CN202110198542.4

    申请日:2021-02-22

    Abstract: 本发明提出一种融合元路径语义的推荐方法,包括:基于异构信息网络及用户/商品评分数据集,计算所述用户/商品的相对重要性二部图;利用所述相对重要性二部图指导用户/商品结点之间的信息传播,得到所述用户/商品结点的嵌入表达;将所述用户/商品结点的嵌入表达进行变换得到用于推荐的所述用户/商品结点的最终嵌入表达,并将所述用户/商品结点的最终嵌入表达输入一推荐模型得到所述用户/商品的预测分数。

Patent Agency Ranking