-
公开(公告)号:CN116843798A
公开(公告)日:2023-10-03
申请号:CN202310810626.8
申请日:2023-07-03
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06T13/00
Abstract: 本说明书实施例提供了动画生成方法、模型训练方法及装置,动画生成方法的一具体实施方式包括:获取用户针对目标音频自定义的情感序列,情感序列包括按时序排列的若干情感类别,各情感类别用于指示待生成的动画中呈现的面部情感或表情;将目标音频和情感序列输入到参数预测模型进行模型处理,得到参数序列,参数序列包括按时序排列的多个参数组;根据各个参数组,生成对应的包括面部的动画片段,从而生成目标动画。生成的动画可以指示按照时序排列的一系列的情感或表情,生成的动画的生动性较强。
-
公开(公告)号:CN114998575A
公开(公告)日:2022-09-02
申请号:CN202210753302.0
申请日:2022-06-29
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V10/25 , G06V10/774 , G06V10/82
Abstract: 本公开披露了一种训练和使用目标检测模型的方法和装置。所述训练方法包括:将图像输入所述目标检测模型的特征提取网络,以获取所述图像的特征图,所述图像包含多个目标物,所述多个目标物均包括多个检测部位,所述多个检测部位包括第一检测部位和第二检测部位;将所述特征图输入所述目标检测模型的从属关系检测网络,以获取第一结果和第二结果,所述第一结果包括表征所述第一检测部位的检测数据,所述第二结果包括表征与所述第一检测部位属于同一个目标物的第二检测部位的检测数据;根据所述第一结果的损失和所述第二结果的损失,更新所述目标检测模型。
-
公开(公告)号:CN114819140B
公开(公告)日:2025-05-13
申请号:CN202210330396.0
申请日:2022-03-31
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N3/082 , G06N3/0455 , G06N3/0464
Abstract: 本说明书实施例公开了一种模型剪枝方法、装置和计算机设备。所述方法包括:根据剪枝参数,确定掩码信息;所述掩码信息用于指示目标模型中剪枝对象的有效状态;将样本输入至增添了掩码信息后的目标模型,得到目标模型的第一输出;根据第一输出,优化参数信息;所述参数信息包括目标模型的模型参数和剪枝参数;迭代执行以上步骤,直至满足结束条件;根据掩码信息,对剪枝对象进行剪枝处理。本说明书实施例可以对目标模型进行剪枝处理,以减少存储资源和计算资源的占用。
-
公开(公告)号:CN118015300A
公开(公告)日:2024-05-10
申请号:CN202410217187.4
申请日:2023-09-26
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V10/54 , G06V10/75 , G06Q30/0601
Abstract: 本说明书实施例提供了商品纹理检测处理方法及装置,其中,一种商品纹理检测处理方法包括:在获取到进行质量检测的商品配置的实体介质被触发后采集的截面纹理图像后,确定截面纹理图像对应的截面类型,按照截面类型对应的纹理提取方式,从截面纹理图像中提取截面纹理特征,并借助包含截面纹理特征的特征数据集对截面纹理特征进行特征检测,获得商品的检测结果。
-
公开(公告)号:CN117078962B
公开(公告)日:2024-03-19
申请号:CN202311270609.6
申请日:2023-09-27
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供了基于纹理采集的数据上链方法及装置,其中,一种基于纹理采集的数据上链方法包括:在对陶瓷制品的纹理数据进行上链的过程中,响应于终端设备提交的陶瓷制品的纹理采集请求,生成纹理采集页并向终端设备返回后,接收终端设备基于纹理采集页采集并上传的陶瓷制品的纹理图像集和出厂信息,并对纹理图像集中包含的各纹理图像进行图像检测,在检测通过后,进行纹理图像集和出厂信息的上链处理,以根据链上存储的纹理数据进行陶瓷制品的纹理识别。
-
-
公开(公告)号:CN117541459A
公开(公告)日:2024-02-09
申请号:CN202311542623.7
申请日:2023-11-17
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06T3/04 , G06T5/70 , G06T5/50 , G06V40/16 , G06V10/774 , G06V10/74 , G06V10/82 , G06N3/0455 , G06N3/08
Abstract: 本说明书实施例涉及一种图像生成模型的训练方法及装置,图像生成模型包含人脸一致性模块和训练好的扩散模型,扩散模型包括加噪模块和第一去噪网络,所述方法包括:将原始人脸图像输入加噪模块,得到第一噪声图像,然后将第一噪声图像输入第一去噪网络,得到具有第一风格的第一人脸图像,接着将第一噪声图像输入由第一去噪网络和人脸一致性模块融合形成的第一融合模块中进行融合处理,得到第二人脸图像,接下来根据原始人脸图像与第二人脸图像之间的人脸相似度,确定第一损失,根据第一人脸图像与第二人脸图像之间的风格相似度,确定第二损失,最后基于第一损失与第二损失的总损失,调整人脸一致性模块的参数。
-
公开(公告)号:CN116978003A
公开(公告)日:2023-10-31
申请号:CN202311235847.3
申请日:2023-09-22
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V20/68 , G06V10/54 , G06V10/75 , G06V10/764
Abstract: 本说明书实施例提供了食材商品的纹理检测处理方法及装置,其中,一种食材商品的纹理检测处理方法包括:在进行食材商品的纹理检测过程中,获取用户终端对食材商品进行表面纹理采集获得的纹理图像,对纹理图像进行至少一个特征维度的纹理特征提取,根据特征提取结果确定食材商品的纹理特征分布,根据食材商品的标识信息确定食材商品的对比纹理图像的对比纹理分布,基于对比纹理分布对食材商品的纹理特征分布进行纹理特征检测,获得食材商品的纹理检测结果。
-
公开(公告)号:CN116934883A
公开(公告)日:2023-10-24
申请号:CN202310904141.5
申请日:2023-07-21
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种针对目标序列进行模态转换的方法及装置,在模态转换的方法中,获取第一模态序列,其中包括若干第一模态特征数据。通过编码器,对各个第一模态特征数据逐个进行编码,得到对应的各个第一模态编码,各个第一模态编码形成第一编码序列。通过第一解码器,并行地基于各个第一模态编码,预测各自对应的各个第二模态编码,各个第二模态编码形成第二编码序列。通过第二解码器,基于第一编码序列,利用交叉注意力机制,对第二编码序列进行修正,得到修正编码序列。根据修正编码序列,确定对应于第一模态序列的第二模态序列,该第二模态序列包括若干第二模态特征数据,其用于驱动虚拟形象影像的合成。
-
公开(公告)号:CN116797877A
公开(公告)日:2023-09-22
申请号:CN202310762872.0
申请日:2023-06-26
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V10/774 , G10L25/57 , G06V10/80 , G06V20/40 , G06V40/16
Abstract: 本说明书实施例提供了图像生成模型的训练方法及装置、图像生成方法及装置。图像生成模型包括生成器,该训练方法包括:获取训练样本,其中包括语音信息、唇形与语音信息同步的真实图像帧序列、通过对真实图像帧序列中的图像帧的下半脸区域进行遮挡处理而获得的遮挡图像帧序列、脸部参考图像帧序列和牙齿参考图像,真实图像帧序列和脸部参考图像帧序列中的图像帧为同一对象的脸部图像;将语音信息、遮挡图像帧序列、脸部参考图像帧序列和牙齿参考图像输入生成器进行模型处理,得到针对遮挡图像帧序列中的图像帧的下半脸区域进行重建的重建图像帧序列;基于重建图像帧序列和真实图像帧序列确定预测损失;以最小化预测损失为目标,调整生成器的参数。
-
-
-
-
-
-
-
-
-