-
公开(公告)号:CN118799460A
公开(公告)日:2024-10-18
申请号:CN202410016562.9
申请日:2024-01-05
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
Abstract: 本发明提供一种视频生成方法、装置、设备及介质。本发明的方法,包括:针对第一视频中的帧图像,将帧图像、第一目标外貌图像和多帧第一稠密姿态图像输入至视频生成模型,获得第一噪声;其中,第一目标外貌图像为具有第一目标外貌的人物图像,多帧第一稠密姿态图像包括连续多帧与第一目标姿态相关的人物图像,视频生成模型包括训练后的第一噪声预测模型和训练后的第二噪声预测模型,训练后的第一噪声预测模型用于捕捉目标姿态,训练后的第二噪声预测模型用于恢复目标外貌;对第一噪声进行去噪处理,获得去噪后的帧图像;根据去噪后的帧图像,生成第二视频。本发明的方法能够大大提升了生成视频的视觉质量。
-
公开(公告)号:CN118799447A
公开(公告)日:2024-10-18
申请号:CN202410302507.6
申请日:2024-03-15
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
IPC: G06T11/60 , G06T5/50 , G06T5/77 , G06N3/094 , G06N3/0475 , G06N3/045 , G06N3/0464
Abstract: 本申请实施例提供了一种图像编辑方法、图像编辑装置及存储介质,该方法包括:图像编辑装置将待预测图像输入至目标扩散模型,获得待预测图像对应的第一目标图像;其中,目标扩散模型包括融合模块和目标图像生成模块,融合模块用于将待预测图像对应的第一特征图和待预测图像对应的第二特征图进行融合处理;目标扩散模型是基于训练图像集对初始图像生成模块进行训练获得的;初始图像生成模块包括修复模块,修复模块用于将随机掩码和训练图像集中的第二目标图像对应的初始权重图进行融合处理,从而可以提高模型的预测精准度。
-