图像处理模型训练、处理方法、系统、设备及其介质

    公开(公告)号:CN116580263A

    公开(公告)日:2023-08-11

    申请号:CN202310562166.1

    申请日:2023-05-18

    Abstract: 本发明公开了一种图像处理模型训练、处理方法、系统、设备及其介质。该模型的训练方法包括:获取原始三维面部数据和若干样本音频数据;提取原始三维面部数据的样本面部特征;获取样本音频数据的样本音频特征;基于样本音频特征调整样本面部特征,以得到对应的样本三维面部数据;以每组的样本面部特征与样本音频特征作为输入,对应的样本三维面部数据作为输出,对预设网络进行训练,以得到图像处理模型。通过图卷积神经网络获取面部特征和多层次处理得到音频特征,通过卷积神经网络的训练,得到的图像处理模型具有更高的精度、泛用性和鲁棒性。计算融合特征的融合损失和样本三维面部数据的生成损失,提高模型训练的效率和准确性。

    用于确定液体体积的方法及装置、存储介质、终端

    公开(公告)号:CN115239789B

    公开(公告)日:2023-06-27

    申请号:CN202210565544.7

    申请日:2022-05-23

    Abstract: 一种用于确定液体体积的方法及装置、存储介质、终端,所述方法包括:获取待处理图像,所述待处理图像包括所述目标容器的影像;确定单位长度,所述单位长度是指单位体积的液体在所述待处理图像中在第一方向上对应的像素点的数量,所述第一方向为所述刻度线的分布方向;确定液面位置和参考位置,其中,所述液面位置为所述液面在所述待处理图像中在所述第一方向上的位置,所述参考位置为参考刻度值对应的刻度线在所述待处理图像中在所述第一方向上的位置;根据所述液面位置、所述参考位置、所述参考刻度值和所述单位长度,确定所述液体的体积。本发明提供了一种通用性、鲁棒性更好的确定液体体积的方法。

    虚拟换装方法、系统、设备、存储介质和程序产品

    公开(公告)号:CN120070670A

    公开(公告)日:2025-05-30

    申请号:CN202510171202.0

    申请日:2025-02-17

    Abstract: 本公开提供了一种虚拟换装方法、系统、设备、存储介质和程序产品。所述虚拟换装方法包括:获取用户图像和目标服装图像;对所述用户图像进行衣物分割处理,得到原始服装图像和人体图像;对所述目标服装图像进行分层处理,得到若干张服装子图像;基于所述原始服装图像对所述服装子图像进行变换,得到所述服装子图像对应的目标服装子图像;将所述人体图像和所述目标服装子图像进行融合处理,生成换装后的目标用户图像。本公开通过对服装进行分层处理以保留换装后的服装细节,并进行人体修复使得换装图像中的人物更加真实和自然,从而得到更高质量的换装图像,提高用户体验。

    人脸融合方法、系统、设备、介质和程序产品

    公开(公告)号:CN119339423A

    公开(公告)日:2025-01-21

    申请号:CN202411435650.9

    申请日:2024-10-15

    Abstract: 本公开提供了一种人脸融合方法、系统、设备、介质和程序产品,该人脸融合方法包括:获取至少两张待融合人脸图像的实际关键点;基于预设关键点和实际关键点,得到待融合人脸图像对应的位置调整系数;基于位置调整系数对待融合人脸图像进行调整,以得到调整后的待融合人脸图像;对调整后的待融合人脸图像进行人脸融合处理,以得到目标人脸融合图像。本公开通过预设关键点和待融合人脸图像的实际关键点,以得到位置调整系数,根据位置调整系数对待融合人脸图像进行调整,再进行人脸融合处理,改善了人脸融合图像的质量,提升了融合效果,降低了人脸融合处理的难度和资源消耗。

    一种人形机器人控制方法、系统、存储介质和程序产品

    公开(公告)号:CN119238533A

    公开(公告)日:2025-01-03

    申请号:CN202411651055.9

    申请日:2024-11-18

    Abstract: 本发明提供一种人形机器人控制方法、系统、存储介质和程序产品,属于计算机视觉领域。其中方法包括:预处理专家动作数据,将专家动作数据处理成和目标机器人骨骼架构相当的专家数据;在仿真环境中采用人形结构搭建机器人,配置机器人的关节参数,每个关节自由度由独立的物理控制模块进行控制;构建机器人的策略表征方法,包括状态空间、动作空间、奖励函数、多帧式控制方式;对机器人进行初始化;最小化每帧上的机器人动作与专家动作间的差异,最大化奖励函数,驱动机器人学习。本发明可以辅助人形机器人的学习过程,使得机器人可以在完成任务的同时拟人化,并且训练速度有所提升。

    一种视觉Transformer模型设计方法、装置、存储介质和程序产品

    公开(公告)号:CN118840414A

    公开(公告)日:2024-10-25

    申请号:CN202411038198.2

    申请日:2024-07-30

    Abstract: 本发明提供一种视觉Transformer模型设计方法、装置、存储介质和程序产品,其中,方法包括:设定最小形变图像的大小和最小区域块的大小;根据原图的宽高,得到原图的长边与短边之比取整的值,确定形变目标图像的一边长和待划分区域块的一边长;根据原图的长边与短边之比取整的值,计算出形变目标图像的宽高和待划分区域块的宽高;根据形变目标图像的宽高和待划分区域块的宽高,对图像进行形变和划分,得到若干区域块,送入Transformer结构中。将每个区域块划分成若干方块,对所述若干方块进行编码,得到每个区域块特征;整合所有的区域块特征,送入Transformer结构中进行训练。本发明可以在较少形变情况下提取更符合原始图像的特征信息。

    一种基于缺陷描述的缺陷分类方法及系统

    公开(公告)号:CN118585876A

    公开(公告)日:2024-09-03

    申请号:CN202410487378.2

    申请日:2024-04-22

    Abstract: 本发明提供一种基于缺陷描述的缺陷分类方法及系统,其中方法包括以下步骤:获得缺陷图像和对应的缺陷描述文本;将所述缺陷图像送入视觉编码器中进行编码,得到视觉特征;将所述缺陷描述文本送入语义编码器中进行编码,得到语义特征;将所述视觉特征送入多层感知机,经过激活函数,得到在每个候选标签上的概率预测p1,计算损失L1;将所述视觉特征和所述语义特征进行融合后,经过激活函数,得到在每个候选标签上的概率预测p2,计算损失L2;对所述损失L1和所述损失L2进行融合,得到最终损失;对所述概率预测p1和所述概率预测p2进行融合,取融合后最大概率值所属标签为缺陷预测结果。本发明能够更加准确地界定不同类别之间的区别,提高分类的准确率。

Patent Agency Ranking