-
公开(公告)号:CN118823500A
公开(公告)日:2024-10-22
申请号:CN202410135803.1
申请日:2024-01-31
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
IPC: G06V10/774 , G06V10/26 , G06V10/82 , G06V10/44 , G06V10/77 , G06V10/80 , G06V20/70 , G06V40/10 , G06N3/0455 , G06N3/0464 , G06N3/0895
Abstract: 本申请公开了一种人像分割模型的训练及应用方法、装置、设备、介质和产品。该训练方法包括:对未标注的初始图像样本进行遮挡处理,生成未标注的预训练图像样本;基于初始图像样本和预训练图像样本,预训练第一人像分割模型,直至得到预训练好的第一人像分割模型,第一人像分割模型用于对预训练图像样本的遮挡区域进行预测;调整第一人像分割模型的输出层和第一人像分割模型的损失函数,构建第二人像分割模型的网络结构;基于已标注的图像样本和第二人像分割模型的网络结构,调整第二人像分割模型,直至得到调整好的第二人像分割模型。如此,在提升人像分割模型的准确性的同时,又降低了人像分割模型的成本。
-
公开(公告)号:CN118799460A
公开(公告)日:2024-10-18
申请号:CN202410016562.9
申请日:2024-01-05
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
Abstract: 本发明提供一种视频生成方法、装置、设备及介质。本发明的方法,包括:针对第一视频中的帧图像,将帧图像、第一目标外貌图像和多帧第一稠密姿态图像输入至视频生成模型,获得第一噪声;其中,第一目标外貌图像为具有第一目标外貌的人物图像,多帧第一稠密姿态图像包括连续多帧与第一目标姿态相关的人物图像,视频生成模型包括训练后的第一噪声预测模型和训练后的第二噪声预测模型,训练后的第一噪声预测模型用于捕捉目标姿态,训练后的第二噪声预测模型用于恢复目标外貌;对第一噪声进行去噪处理,获得去噪后的帧图像;根据去噪后的帧图像,生成第二视频。本发明的方法能够大大提升了生成视频的视觉质量。
-
公开(公告)号:CN118799447A
公开(公告)日:2024-10-18
申请号:CN202410302507.6
申请日:2024-03-15
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
IPC: G06T11/60 , G06T5/50 , G06T5/77 , G06N3/094 , G06N3/0475 , G06N3/045 , G06N3/0464
Abstract: 本申请实施例提供了一种图像编辑方法、图像编辑装置及存储介质,该方法包括:图像编辑装置将待预测图像输入至目标扩散模型,获得待预测图像对应的第一目标图像;其中,目标扩散模型包括融合模块和目标图像生成模块,融合模块用于将待预测图像对应的第一特征图和待预测图像对应的第二特征图进行融合处理;目标扩散模型是基于训练图像集对初始图像生成模块进行训练获得的;初始图像生成模块包括修复模块,修复模块用于将随机掩码和训练图像集中的第二目标图像对应的初始权重图进行融合处理,从而可以提高模型的预测精准度。
-
公开(公告)号:CN118799445A
公开(公告)日:2024-10-18
申请号:CN202410014944.8
申请日:2024-01-04
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
Abstract: 本申请实施例公开了一种图像合成方法、装置、设备及计算机可读存储介质,其中,所述方法包括:基于第一图像,确定N个第一对象的深度值以及掩码,N为正整数,所述第一图像包括所述N个第一对象;基于M个第二图像,确定M个第二对象的深度值以及掩码,M为正整数,所述M个第二图像中的每个第二图像包括一个所述第二对象;基于所述第一图像、所述M个第二图像、所述N个第一对象的深度值以及掩码和所述M个第二对象的深度值以及掩码,生成合成图像以及所述合成图像对应的掩码;所述合成图像包括所述N个第一对象和所述M个第二对象,且在所述合成图像中深度值较小的对象覆盖深度值较大的对象。
-
-
-