训练评估模型、评估视频质量的方法及装置

    公开(公告)号:CN117012228A

    公开(公告)日:2023-11-07

    申请号:CN202310943184.4

    申请日:2023-07-28

    Inventor: 李文 王萌 邹城

    Abstract: 本说明书实施例提供一种训练评估模型、评估视频质量的方法及装置,在训练评估模型的方法中,获取样本集,其中包括,音画同步的第一视频样本。对第一视频样本进行音画分离,得到样本图像帧序列和对应的样本音频帧序列,并将其输入评估模型进行模型处理,该评估模型包括第一编码器和第二编码器。上述模型处理包括,利用第一编码器,对各样本图像帧进行编码,得到各样本图像表征,以及利用第二编码器,对各样本音频帧进行编码,得到各样本音频表征。以最小化第一损失为目标,调整第一编码器和第二编码器的参数,该第一损失正相关于,各样本图像表征与对应样本音频表征的不同模态间距离,以及各样本图像表征中相邻样本图像表征的同模态间距离。

    动画生成方法、模型训练方法及装置

    公开(公告)号:CN116843798A

    公开(公告)日:2023-10-03

    申请号:CN202310810626.8

    申请日:2023-07-03

    Abstract: 本说明书实施例提供了动画生成方法、模型训练方法及装置,动画生成方法的一具体实施方式包括:获取用户针对目标音频自定义的情感序列,情感序列包括按时序排列的若干情感类别,各情感类别用于指示待生成的动画中呈现的面部情感或表情;将目标音频和情感序列输入到参数预测模型进行模型处理,得到参数序列,参数序列包括按时序排列的多个参数组;根据各个参数组,生成对应的包括面部的动画片段,从而生成目标动画。生成的动画可以指示按照时序排列的一系列的情感或表情,生成的动画的生动性较强。

    基于纹理采集的数据上链方法及装置

    公开(公告)号:CN118097181A

    公开(公告)日:2024-05-28

    申请号:CN202410221053.X

    申请日:2023-09-27

    Abstract: 本说明书实施例提供了基于纹理采集的数据上链方法及装置,其中,一种基于纹理采集的数据上链方法包括:在对陶瓷制品的纹理数据进行上链的过程中,响应于终端设备提交的陶瓷制品的纹理采集请求,生成纹理采集页并向终端设备返回后,接收终端设备基于纹理采集页采集并上传的陶瓷制品的纹理图像集和出厂信息,并对纹理图像集中包含的各纹理图像进行图像检测,在检测通过后,进行纹理图像集和出厂信息的上链处理,以根据链上存储的纹理数据进行陶瓷制品的纹理识别。

    图像模型训练方法、图像处理方法、装置、介质及设备

    公开(公告)号:CN116246127A

    公开(公告)日:2023-06-09

    申请号:CN202310146035.5

    申请日:2023-02-14

    Abstract: 本说明书实施例公开了一种图像模型训练方法、图像处理方法、装置、存储介质及设备。该方法包括:将样本图像划分为多个图像分块,确定各个图像分块对应的分块向量,多个图像分块对应的分块向量形成分块向量序列;将分块向量序列与类标识向量序列进行连接处理,生成连接向量序列;将连接向量序列输入到图像特征提取模型,获取与N个输入类标识向量对应的N个输出类标识向量;基于输出类标识向量以及样本图像的标签,确定图像特征提取模型的模型损失,模型损失包括类标识约束损失,类标识约束损失用于通过约束输出类标识向量来学习样本图像的多类图像特征;基于模型损失调整输入类标识向量的参数以及图像特征提取模型的参数。

    基于多任务学习模型的目标检测方法及装置

    公开(公告)号:CN115457639A

    公开(公告)日:2022-12-09

    申请号:CN202211215104.5

    申请日:2022-09-30

    Abstract: 本公开披露了一种基于多任务学习模型的目标检测方法及装置。所述方法包括:将图像输入所述多任务学习模型的特征提取网络,以提取所述图像的多层特征图,所述图像包括目标物,所述多层特征图包括第一层特征图和第二层特征图,所述第一层特征图的特征深度大于所述第二层特征图的特征深度;将所述第一层特征图输入所述多任务学习模型中的第一子任务网络,以获取所述目标物的第一边界框的检测数据;将所述第二层特征图输入所述多任务学习模型中的第二子任务网络,以获取所述目标物的第一关键点的检测数据。

    动画生成方法、模型训练方法及装置

    公开(公告)号:CN116843798B

    公开(公告)日:2024-07-05

    申请号:CN202310810626.8

    申请日:2023-07-03

    Abstract: 本说明书实施例提供了动画生成方法、模型训练方法及装置,动画生成方法的一具体实施方式包括:获取用户针对目标音频自定义的情感序列,情感序列包括按时序排列的若干情感类别,各情感类别用于指示待生成的动画中呈现的面部情感或表情;将目标音频和情感序列输入到参数预测模型进行模型处理,得到参数序列,参数序列包括按时序排列的多个参数组;根据各个参数组,生成对应的包括面部的动画片段,从而生成目标动画。生成的动画可以指示按照时序排列的一系列的情感或表情,生成的动画的生动性较强。

Patent Agency Ranking